IT

책 "선형대수와 통계학으로 배우는 머신러닝 with 파이썬" 리뷰 [IT/머신러닝]

BoBooBoo 2021. 2. 26. 23:08
반응형

선형대수와 통계학으로 배우는 머신러닝

대상 독자와 구성

 

"머신러닝을 독학하는 독자"

간단하게 이전에 머신러닝을 배워보려다가 때려치웠거나 아직도 잘 모르겠는 사람이나 개념적으로만 알고 있는 그런 사람들을 위한 책입니다. 저처럼 근본없이 공부해서 머리 속에 정리가 안되있는 사람이 보면 참 좋을 것 같네요.

 

책은 전체 12개 chapter 중 전반부 2~7 chapter 는 머신러닝에 대한 기본 개념, 선형대수와 통계학 등 이론과 관련된 내용을 설명하고 후반부 8~12 chapter 는 실습 위주로 사이킷런과 같은 라이브러리를 이용해서 실제로 다양한 머신러닝 모델을 구현해보는 내용으로 구성되어 있습니다. 저자(장철원)님은 머신러닝을 처음 접하는 사람은 후반부부터, 이미 해본 적 있는 사람은 처음부터 순서대로 보는 것을 추천합니다. 아무래도 머신러닝은 기본이 되는 수학적인 내용이 꽤나 많기 때문에 처음 공부하는 사람이 이론부터 보고 있으면 실습도 못해보고 이 분야에 질려버릴 수도 있기 때문이겠지요. 저는 엉망진창으로 공부를 해와서 때문에 아는데 알기만 하는 상태.. 라서 처음부터 보기로 했습니다.

 

 

 

확률 밀도 함수는 probability density function, pdf 이다

용어 (Term, T)

제대로 정독한 건 한권도 없지만 이 책 외에도 통계학, 선형대수와 관련된 책이 3권 더 있습니다. 여러 책들을 훑어봤는데, 생각보다 꽤 많은 책들이 "한글 (번역) 용어, 영어 약자, 영어 풀네임" 을 제대로 명시 하지 않고 막 쓰는 경우가 많았지요. 한글로 과하게 번역된 (특히 대학 교재로 많이 사용되는 것들) 책들은 과하게(?) 한글화되어 있고, 한글 번역 단어로 설명하다가 뒤에 가서는 갑자기 영어 약자로 쓰고... 아마도 코드에서는 영어로 써야하니까 그런 것 같기도 하고. 아무튼 별 거 아닌 것 같지만 이 책처럼 처음 단어가 언급될 때 "확률 밀도 함수(probability density function, pdf)"  딱 이렇게만이라도 써주면 입문자로서 처음 책을 읽을 때 정말 이해하기 좋으니 다른 책들도 이렇게 꼭 되있었으면 좋겠습니다.

 

 

 

주입식 교육을 받은 자로서 이런 풀이 정말 너무 매우 심히 고맙습니다

공식 + 풀이(자세하게)

머리가 굳은지라 이제 공식만 알려주면 절대 네버 못외우고 그나마 풀이를 알려주면 이해정도는 가능한 것 같습니다. 시중의 머신러닝을 위한 통계, 선형대수와 관련된 책을 보면, 어쨋든 핵심은 머신러닝이지 수학이 핵심이 아니다보니 뭔가 자세한 듯 하면서도 대충 설명하고 나열해놓은 경우가 많습니다. (아니 거의다 그런 것 같습니다). 이 책이 최선일지는 모르겠으나 통계, 선형대수의 수학적 개념을 같이 공부하면서 보기에는 현재로는 가장 좋지 않을까 싶네요. 책을 두껍게 만드는 큰 요인이긴 합니다만 학부 때 흉기같은 크기의 calculus 책 하나 쯤은 다 들고 다녔잖아요?

 

 

 

전반부 (챕터 2~7) 를 안봐도 되는 이유는 상세한 풀이과정에 있다

후반부 챕터 8부터의 실습을 바로봐도 되는 이유는 수학적 개념이 부족하더라도 구현하는데 필요한 이론과 그 이유를 위와 같이 초심자가 봐도 이해할 수 있도록 서술하고 있기 때문입니다. 수식에 익숙한 사람은 알파벳이나 로마, 그리스어로 된 멋있는 수학적 기호를 써서 간단하게 표시하면 정말 좋지만, 안타깝게도 그 식을 보는 순간 때려치우는(?) 사람이 꽤 많다고 생각합니다. 다행히 이 책은 그런 부분을 최소화할려고 노력한 부분이 많이 보입니다.

 

 

 

그릴 수 있는 건 다 그려놓은 것 같다

엄청 많은 그림이나 그래프

요새 나오는 머신러닝 관련 책들 대부분 좋고 위와 같은 그림도 많이 표현되어 있지만 전체적으로 훑어봤을 때 저자님이 좀 더 정성을 다했다라고 느껴지는 부분이 많았습니다. 정말 왠만해서 표현할 수 있는 식이나 알고리즘은 모두 그림으로 그려 놓았습니다. 이 또한 전반부를 안봐도 되는 이유 중 하나가 되겠지요. 그렇다고 전반부와 중복되는 내용까지 그려놓은 것은 아니고 다른 방법(식, 그림, 그래프)으로 표현해서 이해를 돕는다고 보면 될 것 같습니다.

 

 

전체적인 평

 

책이 꽤 두껍습니다. 그런데 읽어보니 이유 있는 두꺼움입니다.

 

확실하게 입문자를 위해서 잘 만들어졌고 이미 내용을 알고 있는 사람이 빠르게 훑어보는 용도로 사용해도 좋을 것 같습니다. 무엇보다 학교에서 수업 교재로 쓰면 정말 좋겠다고 생각이 드네요. 이론수업(전반부), 실습수업(후반부) 를 동시에 진행할 수도 있으니 수학+프로그래밍을 같이 배울 수 있을 것 같습니다. 머신러닝, 통계학, 선형대수에 대한 기본기를 같이 잡고 싶은 사람에게는 추천할 수 있겠네요.

 

다만, 책 제목에 '텐서플로' 가 적혀있긴 하지만 목적이 싸이킷런이나 텐서플로를 익히고 싶은 사람이라면 이보다 좋은 책들이 많으니 다른 책을 추천할 것 같습니다. 

 

 

반응형