IT

[북리뷰] 『혼자 공부하는 데이터 분석 with 파이썬』1:1 과외하듯 배우는 데이터 분석 자습서 (한빛미디어)

BoBooBoo 2023. 1. 24. 19:14
반응형

 

 

 

작성일: 2023. 1. 24. 화요일

내용: IT 개발 도서 리뷰

제목:혼자 공부하는 데이터 분석 with 파이썬』1:1 과외하듯 배우는 데이터 분석 자습서

출판사: 한빛미디어

저자: 백해선

분야: 데이터 과학, 인공지능, 통계학, 머신러닝, 빅데이터 비즈니

출간일 : 2023년 01월 02일

 

 

혼자 공부하는 데이터 분석 with 파이썬 | 박해선 - 교보문고

혼자 공부하는 데이터 분석 with 파이썬 | 혼자 해도 충분하다! 1:1 과외하듯 배우는 데이터 분석 자습서이 책은 독학으로 데이터 분석을 배우는 입문자가 ‘꼭 필요한 내용을 제대로 학습’할 수

product.kyobobook.co.kr

 

 

    새해 첫 날. 혼공 시리즈의 새로운 책이 나왔습니다. "혼자 공부하는 데이터 분석 with 파이썬". 박해선님의 책입니다. 책을 내는 속도가 제가 공부하는 속도보다도 더 빨라서 도대체 이게 무슨 일인가 싶습니다. 벌써 5권의 혼공 시리즈 책을 보유하게 되었네요. 책을 모으려고 하는건지 공부를 하는 건지 조금 헷갈리긴 하지만 그래도 나름 열심히 보려고 노력하고 있습니다. 여느 혼공 책들과 마찬가지로 유투브 강의를 함께 제공하고 있네요. 오픈 채팅방도 들어갈 수 있습니다. 저는 이 책이 발간되기도 전에도 들어가 있었어요. 유투브 강의는 이제 막 하나씩 공개되고 있으니 책을 구매하신 분들은 꼭 유투브에서 검색해보시기 바랍니다.

 

 

혼자 공부하는 데이터 분석 with 파이썬

[혼자 공부하는 데이터 분석 with 파이썬] 강의 동영상 혼자 공부하는 데이터 분석 with 파이썬: https://tensorflow.blog/hg-da 깃허브: https://github.com/rickiepark/hg-da 유튜브: http://bit.ly/hg-da-you...

www.youtube.com

 

 

    최근에는 워낙 많은 파이썬을 사용한 데이터 분석 책이 많다보니 목차나 내용에서 구성이 다른 어떤 것보다 좋다라고 표현하기는 좀 힘들어졌습니다. 얼마나 내용이 충실한가, 어느 정도의 수준을 가진 사람들을 대상으로 하는지를 봐야겠죠. 혼자 공부하는 데이터 분석 with 파이썬은 혼공 시리즈 답게 입문 수준을 대상으로 혼자 공부할 수 있는 커리큘럼을 잘 제공하고 있습니다. 게다가 강의까지 무료로 제공하지요. 데이터 분석이란 무엇인지부터 시작해서 다양한 정보를 수집하고 분석하고 시각화하는 내용까지 알차게 포함되어 있습니다. 가장 마지막 단원에서는 아주 간단한 머신러닝 툴도 사용해 볼 수 있어요. 저는 이미 봤지만 이 다음 책으로는 벌써 출간되어 있는 혼자 공부하는 머신러닝을 바로 보면 될 것 같네요. 

 

 

    데이터 분석을 처음 공부하는 사람들의 공통적인 질문이 있습니다. 데이터는 어디서 구해요? 

데이터라는게 세상에 널렸다고 이야기하지만 실제로 우리가 사용할 수 있는 데이터가 어디에 있는지 어떻게 얻을 수 있는지는 아직도 모르는 사람이 많습니다. 그나마 개발자들은 이제 어느 정도는 익숙해지긴 한 것 같습니다. 이 책에서도 당연히 데이터 분석에 직접 들어가기 전에 어떤 데이터를 어디서 구할 수 있는지부터 알려줍니다. 웹 크롤링을 통해 데이터를 직접 수집하거나 공개 API 를 이용하는 방식으로 제공하는 데이터를 얻는 방법 등을 말이죠.

 

 

    이렇게 얻어온 데이터들을 이용해서 선 그래프, 도트 그래프, 히스토그램 등 다양한 차트로 표현하면서 시각화하는 과정도 간단하게 해볼 수 있습니다. 결국은 사람이 잘 이해하는 형태로 만드는 것이 목표이기 때문이지요. 이 과정이 재밌으신 분들은 이 쯤에서 책을 덥고 진짜 시각화에 집중하는 교재로 넘어가도 좋을 것 같습니다. 그치만 이미 폈으니까 완독을 위해 끝까지 한번 가보시죠.

 

 

    데이터가 복잡해 질수록 시각화된 그림에도 더 많은 정보가 포함되어야 합니다. 그렇다고 사람이 보기 힘들어질 정도까지 가버리면 뭔가 배보다 배꼽이 더 커져버리는 경우가 발생하겠지요. 이미지를 첨부하지는 않았지만 데이터 수집의 단계 이후에 데이터를 정제하는 과정에 대해서도 배웁니다. 전처리, preprocessing 라는 내용으로 인공지능 수업에서도 배우는 내용인데 어떤 데이터 과학자 분들이 말하기에는 데이터 분석의 90%는 전처리가 결정하는 것 같다라고 하더군요. 책의 목차에도 중요하니 2번 보라고 표시를 해뒀습니다. 잘 이해되지 않는다면 우리 모두 꼭 여러번 보고 지나갑시다. 솔직히 다른 파트에 비해 재미는 없습니다 (소근소근).

 

 

    마치 혼자 공부하는 머신러닝 책의 프리뷰를 보는 기분입니다. 최근 저자님과 함께 하는 카톡방이나 데이터 분석을 시작하는 분들 중에 혼자공부하는 시리즈의 파이썬, 데이터분석 with 파이썬, 머신러닝 이렇게 3개 세트로 사시는 분들도 종종 보이던데 이렇게 가벼우면서도 폭넓게 배울 수 있는 시리즈 책들이 제공되고 있다는 것을 보면 개발자가 공부하기 정말 좋은 환경이 되고 있다고 느껴집니다. 물론 모든 책의 강의도 제공됩니다. 이 책 마지막 단원에서는 지금까지 봐온 데이터들을 머신러닝 기법을 통해 분석해보는 작업을 간단하게 해볼 수 있습니다. 입문자들에게는 호기심을 느끼게 해주기에 딱 충분한 수준으로 생각됩니다. 이 단원이 정말 재밌다면 이제 진짜 머신러닝 책을 보러 가셔도 될 것 같습니다.

 

 

    혼자 공부하는 시리즈는 한빛미디어가 총대를 매고 혼공단이라는 스터디를 운영하고 있어요. 저도 종종 참여한답니다. 이번에는 운영체제 교재로 참여하고 있는데 10년도 더 전에 처음 공부했던 내용인지라 잊고 있었던 부분도 많고 가벼운 마음으로 기초를 다시 공부해보는 기분으로 하고 있어요. 이 책으로도 기회가 되면 참여해보려고 합니다. 후기를 읽으신 분들도 관심이 있으시면 한빛미디어 혼공단에 참여하셔서 같이 공부해보면 좋겠습니다.

 

끝.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형