IT

[IT/머신러닝]『실전 시계열 분석』통계와 머신러닝을 활용한 예측 기법 (한빛미디어) 북 리뷰

BoBooBoo 2021. 12. 26. 13:22
반응형

작성일: 2021.12.26. 일요일

내용: IT 개발 도서 리뷰

제목: 『실전 시계열 분석』 통계와 머신러닝을 활용한 예측 기법 (한빛미디어) 북 리뷰

분야: 데이터분석, 머신러닝, 인공지능, 통계, IT

출간일 : 2021년 04월 09일

 

 

책의 제목 『Practical Time Series Analysis 실전 시계열 분석』 에서 알 수 있듯이 이 책은 실제 환경에서의 시계열 데이터 분석에 초점을 맞춤 실무 지침서이다. 즉, 입문서가 아니다. 저자는 대상 독자로 다음 두 분류를 이야기한다.

  1. 숙련된 산업 종사자나 주니어 분석가, 그러나 시계열 데이터는 다뤄보지 않은 데이터 과학자
  2. 대규모 데이터를 수집하는 기관에 소속된 관리자

 

같은 이유에서 책을 읽으려면 데이터 분석에서 많이 쓰이는 언어와 라이브러리(패키지) 등 일부 도구에 대해서는 익숙해야한다고 소개한다. R과 R의 data.table 같은 패키지 그리고 파이썬과 머신러닝에 많이 사용되는 Numpy, Pandas, scikit-learn 등이 대표적이다. 이와 함께 통계학과 머신러닝의 필수 개념인 아래 내용은 보완할 수 있는 다른 책들을 함께 보는 것이 좋다.

  • 통계학: 분산, 상관관계, 확률분포 등
  • 머신러닝: 군집화, 의사결정 트리 등
  • 신경망 ...

 

시계열 데이터 분석의 연구사례 헬스케어 분야

 

시계열 데이터는 말 그대로 시간 축을 기준으로 축적된 데이터인데, 그렇게 보면 실생활에서 얻을 수 있는 데이터 중 왠만해서는 시계열 데이터가 아닌게 없지 않나...라고 생각이 된다. 이 책은 헬스케어, 금융  분야에서의 실전 시계열 데이터 분석 사계를 소개하고 있다. 내가 과거에 몸담았던 헬스케어 분야가 나와 반갑고, 최근 가장 핫하다고 할 수 있는 금융 데이터를 보니 책을 보는데 더 흥미가 생기는 것 같았다.

 

시계열 데이터 분석의 연구사례 금융데이터 분야

 

특히 금융 데이터분야는 최근 퀀트라는 분야가 떠오르고 있다보니 더 관심이 갔다. 과거의 금융 데이터가 미래의 주가의 향방을 결정하지는 않지만, 어느 정도 보조 지표로써의 기능을 수행하고 있다보니 어떻게 해서든 미래를 예측해보려는 시도가 계속 나타나고 있다. 기존의 퀀트 분석들과 전통적인 통계 기법들이 과거를 만들어 왔다면 앞으로는 머신러닝 기반의 새로운 기법들이 많이 나오지 않을까 싶다. 실제로 인공지능이 투자를 결정하는 ETF 들도 나오고 있고...

 

 

정리하자면,

이 책은 500페이지가 넘는 분량으로 상당히 두껍고 입문자들을 배려하는 책은 아니다. 다만 앞서 말한 프로그래밍 도구들이나 패키지들에 익숙하다면 읽어 나가는데 큰 무리는 없다. 물론 실전에 적용하는 것은 다른 문제. 전통적인 기법으로 시계열 데이터를 분석하는 방법이나 도구에 대한 자료는 꽤 많이 있는데 머신러닝을 이용해 시계열 데이터를 처리하는 방법에 다룬 자료는 생각보다 많지 않다. 그만큼 이 책이 가치있다고도 볼 수 있고, 아직도 전통적인 기법들이 상당히 훌륭한 성능을 보인다고도 볼 수 있다. 맹목적으로 머신러닝을 믿을 순 없지만, 발전한지 아직 얼마 되지 않았으니 앞으로 더 기대할 수 있을 것이다. 그런 면에서 이 책은 기본을 미리 닦아두고 흥미를 유발하기에도 충분하다. 물론 실전적인 내용도 빠짐없이 풍부하게 포함되어 있어서 더욱 좋다.

 

 

끝.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형