IT

[북리뷰] 『데이터 과학 레벨 업 with 로드맵』캐글 그랜드마스터가 알려주는 문제 해결의 기술 (한빛미디어)

BoBooBoo 2023. 5. 28. 23:43
반응형

작성일: 2023. 5. 28. 일요일

내용: IT 개발 도서 리뷰

제목: 『데이터 과학 레벨 업 with 로드맵』 캐글 그랜드마스터가 알려주는 문제 해결의 기술

출판사: 한빛미디어

저자: 콘라트 바나헤비치 , 루카 마사론 저자(글) · 김형민 번역

분야: 프로그래밍, 파이썬, 데이터 과학, 데이터 분석, 머신러닝

출간일 : 2023년 04월 20일

 

 

데이터 과학 레벨 업 with 로드맵 | 콘라트 바나헤비치 - 교보문고

데이터 과학 레벨 업 with 로드맵 | 데이터 과학자여,그랜드마스터로 올라서는 비법이 여기에 있다.실력 향상에 가장 좋은 방법은 실습! 데이터 과학 플랫폼 캐글에서는 다양한 대회에 참가하고

product.kyobobook.co.kr

 

 

    데이터 과학과 관련된 책이나 강의를 이것 저것 보고 있지만 업무에서 실제로 사용하지 않는 경우에는 감각을 유지하기 어렵고 금방 잊어 버려서 아쉬움이 많이 있을 겁니다. 프로그래밍, 알고리즘을 연습할 수 있는 다양한 사이트나 대회가 있듯이 데이터 과학에서도 가장 유명한 대회 플랫폼인 캐글이 있습니다. 이 책은 캐글을 어떻게 활용할 수 있는지, 문제를 어떤 방식으로 해결하는지 등 캐글의 생태계를 활용하고 재미있게 놀 수 있는 방법을 설명하고 있습니다. 이제 막 데이터 과학자가 되려고 이론을 공부한 사람들에게 적절한 책이라고 생각됩니다.

 

 

    『데이터 과학 레벨 업 with 로드맵』은 캐글의 창립자이자 전 CEO 인 앤서니 골드블룸이 추천사를 작성한 책으로 통계학 박사이자 금융 관련 데이터 과학자인 Konard 와 캐글 그랜드 마스터 중 한 명인 Luca 가 작성한 책으로 이미 저자와 추천사만으로도 검증이 끝난 책이라고 봐도 무관할 것 같습니다. 누가 캐글에 있어서 만큼은 이 책을 평가할 수 있을까요. 주요 내용으로는 이제 막 데이터 과학에 입문을 마친 개발자들이 문제 해결하는 방법을 배우는 부분과 실무에서 유용한 팁들 설명하는 것으로 구성되어 있습니다. 가볍게 책을 살펴보면서 어떤 것을 배울 수 있는지 살펴보도록 하겠습니다.

 

 

    『데이터 과학 레벨 업 with 로드맵』은 캐글에 대한 소개와 사용 방법, 포럼 등을 소개하는 Part 1. 캐글 사용법, 대회 그 자체를 소개하며 다양한 기법들과 문제 해결 방법을 배울 수 있는 Part 2. 대회를 위한 테크닉 그리고 친절하게도 우리의 미래까지 챙겨주려는지 데이터 과학 관련 포트폴리오를 관리할 수 있는 방법 외 다양한 정보를 알려주는 Part 3. 데이터 과학 경력 관리까지 총 3개의 파트로 구성되어 있습니다.

 

 

    Part 하나 하나에 들어 있는 정보들도 정말 좋지만 다른 책과의 가장 큰 차이점은 뭐니뭐니해도 수 많은 캐글 그랜드 마스터들의 인터뷰가 아닐까 싶습니다. 각 데이터 과학자들이 주로 다루는 데이터와 소속된 도메인이 다른 것도 재미 있고 특정 문제를 어떻게 해결했는지 아이디어를 소개하는 부분도 정말 흥미롭습니다. 

 

 

    일례로 한 캐글 그랜드 마스터가 "대회에서 어떤 실수를 해봤나요?" 라는 질문에 한 답이 가장 기억에 남습니다. 

 

제가 한 가장 큰 실수는 대회에 참가하지 않은 것이에요.

플랫폼에 들어온 초보자라면 저지르는 가장 크고 기본적인 실수라고 생각해요.

 

 

    인터뷰의 내용 그 자체가 사실 이 책을 구성하는 파트들과 관련이 깊습니다. 이들의 질문과 답변에서 캐글 대회의 문제 해결 방법을 배울 수 있고 접근하는 방법들도 살펴 볼 수 있었습니다. 인터뷰 12는 질로우의 데이터 과학자네요. 부동산에 의료에... 정말 다양한 분야의 데이터 과학자들이 전 세계에서 활동하고 있는 것을 보면 새로운 자극을 받습니다.

 

 

    이 책의 핵심은 다양한 문제 해결 방법을 설명하는 것이기 때문에 각각의 기술들이나 이론에 대해서 깊게 설명하지는 않습니다. 다만 필요한 기술을 설명할 때는 소스코드와 함께 간략하게 설명하긴 합니다. 다만 데이터 과학의 입문자를 위해 쓰여진 책은 아니기 때문에 이 책으로 공부를 시작한다는 것은 조금 힘들 수도 있을 것 같습니다. 다른 책을 함께 본다면 더 큰 시너지를 얻을 수 있을 것 같습니다.

 

함께 보면 좋을만한 데이터 과학 교재

 

 

    가장 주목할 점은 책이 단순히 정보를 제공하는 정도에서 끝 마치지 않으려고 한 노력이 보인다는 것입니다. 단순히 데이터 과학이 재미가 있어서 공부하는 사람들도 있겠지만 대부분의 개발자는 자신의 커리어 개발을 위해 공부하는 경우가 많기 때문입니다. 이 책의 마지막 Part 3. 데이터 과학 경력 관리에서는 이와 관련된 정보를 가볍게나마 알려줍니다. 역시나 개발자 답게 다양한 커뮤니티 활동과 포트폴리오의 관리 등을 적극 권장하고 있습니다. 

 

 

    다른 무엇보다 가장 먼저 쉽게 할 수 있는 것은 관련 내용을 받아 보면서 흥미를 키워보는 것이 아닐까요? 큰 노력없이 지금 바로 할 수 있는 것으로 캐글의 뉴스레터를 받아보는 것을 시작해보면 좋겠습니다. 어떤 것 인지 궁금하고 흥미가 생길 때, 그 때 시작해도 결코 늦지 않을 거라고 생각합니다. 내용을 떠나서 개발자로서 많은 생각을 하게 해주는 책이네요.

 

끝.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형