IT

[북리뷰] 과외하듯 배우는 책『혼자 공부하는 R 데이터분석』(한빛미디어)

BoBooBoo 2022. 2. 18. 23:27
반응형

 

 

 

작성일: 2022. 2. 18. 금요일

내용: IT 개발 도서 리뷰

제목: 『혼자 공부하는 R 데이터분석』 (한빛미디어) 북 리뷰

분야: 데이터분석, 머신러닝, 인공지능, 통계, IT

출간일 : 2022년 01월 17일

 

베타 리딩에 참여한 책으로 한빛미디어의 지원을 받아 작성된 서평입니다.

 

 

혼자 공부하는 R 데이터 분석 - 교보문고

1:1 과외하듯 배우는 데이터 분석 자습서 | 도서 특징 하나, ‘입문자 맞춤형 7단계 구성’을 따라가며 체계적으로 반복하는 탄탄한 학습 설계! 이 책은 R 데이터 분석의 핵심 내용을 7단계에 걸쳐

www.kyobobook.co.kr

 

들어가기 전에...

 

 

 

  『혼자 공부하는 R 데이터 분석은 내가 가지고 있는 4번째 한빛미디어의 혼공 시리즈 책이다. 이제 어떤 분야던지 혼공이 붙어 있으면 믿고 볼 수 있는 신념도 생기는 것 같다. 혼공 시리즈의 책을 보면서 공통적으로 느끼는 점이자 이 책에서도 받았던 생각은 다음과 같다.

 

1. 정말 혼자 공부하기 좋다 = 입문용으로 딱이다.

2. 강의가 제공되서 혼자 공부하기 좋다.

3. 큰 결심없이(?) 스터디 하기에도 정말 좋은 책이다.

 

  실제로 작년 10월부터 12월까지 『혼자 공부하는 파이썬 으로 비전공자들과 함께 스터디를 진행한 적이 있었는데, 생각보다 다들 잘 따라와줬고, 한권을 정독하고 나서 스터디에 대한 평가 뿐만 아니라 책에 대한 평가도 정말 좋았다. 이번에 읽은 『혼자 공부하는 R 데이터 분석 도 기회가 될 때 스터디를 해볼까 하는데, 정말 좋은 평가를 얻을 것 같다.

 

혼자 공부하는 R 데이터분석

 

  몇 년 전만 해도 파이썬을 필두로 한 나름 배우기 쉬운(?) 프로그래밍 언어들이 퍼지지 않았었다. 당시의 데이터 분석은 SAS, SPSS 와 같은 툴을 이용하거나 프로그래밍을 조금 아는 경우는 Matlab 이나 R 을 많이 사용했던 것으로 기억한다. 여전히 많이 사용하고 있는 툴과 언어긴 하지만 파이썬이 영향력이 많이 커지면서 확실히 상대적인 매력도는 많이 떨어진 것 같다. 그럼에도 R 은 여전히 많은 사랑을 받고 있는 것 같은데, 역시 무료라는 점과 그 뒤를 받치는 수 많은 수학, 통계 기반의 라이브러리들이 있기 때문일 것이다.

 

혼자 공부하는 R 데이터분석: R 언어를 소개합니다

 

  책에서도 R 을 소개하면서 파이썬을 잠깐 언급하는데, 다른 부분은 몰라도 통계나 수학 영역에서는 두 언어의 영향력의 차이를 비교하기 힘들다는 것을 말한다. 개인적으로 좀 덜 프로그래밍적인 느낌을 받을 수 있는 언어가 R 이다보니 언어를 배우는 목적이 수학, 통계에 있다면 R 을 먼저 배워보는 것도 정말 좋다고 생각한다. 특히, 최소한 이 분야들에 있어서 만큼은 둘의 프로그래밍 방식이나 라이브러리 사용법 등 공통점이 워낙 많기 때문에 뭘 먼저 배워도 상관없어 보인다.

 

혼자 공부하는 R 데이터분석: 학습 로드맵

 

  어느 책들과 같이 R 에 대한 소개와 개발 환경 설치부터 시작한다. 기본편에서는 R 에서 사용하는 프로그래밍 문법들과 데이터를 다루는 법 (가공, 구조 변경 등) 을 배우고, 고급편에서는 그래프로 표현하는 등 시각화하는 것을 배운다. 전체 8장으로 되어 있어서 8주 완성 스터디로도 딱 좋다. 기본편은 비전공자라고 할 지라도 쉬운 편이니 개인적으로는 6주 완성 정도면 딱 좋다고 생각된다.

 

혼자 공부하는 R 데이터분석: 4장 데이터 수집

 

  기본편의 1~3장은 R 개발 환경과 기본적인 문법을 배우는 부분으로 다른 언어를 한번이라도 배워본 사람은 사실 하루, 이틀 정도면 눈으로만 훑어보고 넘어가도 충분한 시간이라고 생각된다. 4장부터 본격적인 데이터를 다루는 것으로 데이터의 수집부터 시작한다. 위 사진에서도 볼 수 있듯이 가공되지 않은 원시 데이터들을 txt, csv, xlsx 등의 파일로부터 가져오는 것부터 배운다. 주로 데이터 프레임이라는 단위를 많이 사용하게 되는데, 이 장의 실습을 해보면 머리 속에 어떻게 R 이 데이터를 저장하는지를 확실하게 배울 수 있다.

 

혼자 공부하는 R 데이터분석: 고급편의 그래프 그리기

 

  고급편에서는 ggplot 과 같은 라이브러리를 이용하면서 앞에서 다룬 데이터들을 시각적으로 표현하는 방법을 배운다. 아마도 데이터 분석을 처음 시작하는 사람들이 재미를 느낄 수 있는 부분은 이 단원일 것이다. 눈에 보여야 뭔가 하는 기분이 드니까. 기본편에서 수집한 데이터를 가공하고 조작하면서 실제로 그래프로 찍어보면 색다른 재미를 느낄 수 있다.

 

혼자 공부하는 R 데이터분석: 고급편의 프로젝트

 

  마지막 단원은 실제 데이터를 이용해서 간단한 프로젝트를 해보게 된다. 서울시 지역별 미세먼지 농도와 같은 데이터를 다운로드해서 다양한 방법으로 분석하고 표현하는 것을 배울 수 있다. 조금만 응용하면 다양한 데이터들을 직접 수집해서 자신만의 방법으로 표현하는 것을 해볼 수 있을 것이다. 

 

 

정리...

  운 좋게도 새해부터 혼공 시리즈의 책에 베타 리딩을 참여할 수 있었다. 이미 혼공 시리즈 여러 책들을 경험한지라 충분히 기대하고 봤는데, 역시나 기대를 저버리지 않았다. "혼자 공부하는" 에 딱 맞는 책이고 입문용으로는 이만한 책이 많지 않은 것 같다. 그렇지만 여러 사람들과 함께 스터디 교재로 선정해 빠르게 진행하면 더 시너지를 얻을 것이라 확신한다. 한빛미디어에서는 종종 혼공 시리즈로 함께 공부할 수 있도록 하는 이벤트를 진행하기도 하고 스터디를 완료하고 나면 한빛 마일리지를 주는 등 다양한 상품도 주니 꼭 참여해보도록 하자.

 

끝.

 

 

반응형