품목정보
출간일 | 2020년 08월 24일 |
---|---|
쪽수, 무게, 크기 | 288쪽 | 538g | 183*235*12mm |
ISBN13 | 9791165212537 |
ISBN10 | 1165212536 |
출간일 | 2020년 08월 24일 |
---|---|
쪽수, 무게, 크기 | 288쪽 | 538g | 183*235*12mm |
ISBN13 | 9791165212537 |
ISBN10 | 1165212536 |
단순히 수학만 배우는 것이 아니다! 머신 러닝에 수학이 필요한 이유부터 개념, 활용까지 배운다! 수학으로 데이터를 수집, 정제하여 요약할 수 있으며, 문제를 정의하고 논리적으로 해결할 수도 있다. 선형대수, 미분과 적분, 확률과 통계의 기본 개념부터 배우고, 이를 데이터 분석 기법에 활용하는 방법까지 살펴본다. |
1장 데이터 과학과 파이썬 소개 1.1 데이터 과학이란? __1.1.1 아나콘다 설치하기 1.2 선형대수, 미분과 적분, 확률, 통계의 필요성 1.3 그리스 문자와 연산 기호 1.4 데이터와 변수의 이해 __1.4.1 텍스트 마이닝으로 살펴본 비정형 데이터의 분석 1.5 파이썬의 자료 구조 __1.5.1 파이썬 기본 빌트인 구조 __1.5.2 넘파이, 판다스 기반의 자료 구조 __1.5.3 파일로부터 자료 구조 생성하기 1.6 파이썬 실습 1.7 R 실습 1.8 핵심 요약 2장 머신 러닝을 위한 선형대수 2.1 선형대수의 필요성 2.2 벡터와 공간, 행렬과 사상 __2.2.1 벡터의 이해 __2.2.2 벡터의 사칙 연산 __2.2.3 행렬로의 확장 2.3 행렬의 내적과 외적 2.4 행렬 연산의 의미와 활용 __2.4.1 분석모형 응용 - 유사도행렬의 계산 2.5 행렬식, 역행렬 그리고 일차방정식 __2.5.1 분석모형 응용 - 마르코프 체인 2.6 행렬의 분해: 고윳값과 고유 벡터, 대각화 __2.6.1 분석모형 응용 - 주성분 분석 2.7 파이썬 실습 2.8 R 실습 2.9 핵심 요약 3장 미분과 적분의 이해와 응용 3.1 함수의 개념 이해 __3.1.1 함수와 합성 함수 __3.1.2 미분과 적분을 이해하기 위한 몇 가지 개념 3.2 미분의 이해 __3.2.1 간단한 미분 실습 __3.2.2 분석모형 응용 - 신제품 확산 모형 3.3 적분의 이해 __3.3.1 리만 적분 또는 정적분 3.4 미적분학의 기본정리, 편미분 그리고 경사 하강법 __3.4.1 미적분학의 기본정리 __3.4.2 편미분 __3.4.3 분석모형 응용 - 경사 하강법과 뉴턴랩슨 메서드 3.5 파이썬 실습 3.6 R 실습 3.7 핵심 요약 4장 확률과 통계 4.1 기초 통계 개념: 모집단/표본, 모수/통계량 4.2 통계량의 이해: 단변수 통계량 4.3 통계량의 이해: 다변수 통계량 4.4 확률이란 4.5 조건부 확률과 베이즈 정리 4.6 분석모형 응용-확률을 활용한 패턴의 발견 4.7 파이썬 실습 4.8 R 실습 4.9 핵심 요약 5장 확률 분포와 통계적 추론 5.1 확률 변수와 확률 분포 5.2 이산형 확률 분포 __5.2.1 이항 분포 __5.2.2 포아송 분포 5.3 연속형 확률 분포 __5.3.1 정규 분포와 중심 극한 정리 __5.3.2 t 분포 __5.3.3 χ2 분포 __5.3.4 F 분포 5.4 통계적 추론, 점 추정과 구간 추정 5.5 가설 검정 5.6 다양한 통계 검정 __5.6.1 정규성 검정 __5.6.2 t 검정 __5.6.3 쌍체 t 검정 __5.6.4 등분산 검정: F 검정 __5.6.5 χ2 검정 178 5.7 가설 검정의 오류 178 5.8 파이썬 실습 179 5.9 R 실습 182 5.10 핵심 요약 6장 상관분석과 분산분석 6.1 상관분석 6.2 분산분석 __6.2.1 일원 분산분석 __6.2.2 다중 비교 __6.2.3 이원 분산분석 6.3 상관분석의 활용 6.4 파이썬 실습 6.5 R 실습 6.6 핵심 요약 7장 선형 회귀 분석과 모형 확장 7.1 얇고도 깊은 분석의 목적 7.2 선형 회귀 분석 7.3 선형 회귀 분석의 주요 개념 7.4 모형의 예측과 오차의 측정 7.5 회귀모형의 확장1: 포아송 회귀모형 소개 7.6 선형모형의 확장2: 로지스틱 회귀모형 소개 __7.6.1 분류모형의 평가 7.7 파이썬 실습 7.8 R 실습 7.9 핵심 요약 8장 머신 러닝, 딥러닝 그리고 AI 8.1 데이터 분석에서 머신 러닝의 부상 8.2 딥러닝의 배경 및 개요 8.3 다양한 딥러닝 도구 __8.3.1 텐서플로 설치하기 8.4 딥러닝의 활용 8.5 파이썬 실습 8.6 R 실습 8.7 핵심 요약 부록 A 텐서플로 GPU 버전 설치하기 부록 B R 설치하기 부록 C Colab 사용하기 찾아보기 |
데이터 과학을 공부하면서 "수학"은 정말 중요한 부분입니다. 그 안에는 모두 수학이 담겨있기 때문입니다. 수학적 내용이 이애하기는 어렵지만 한 번 이해를 하고 익숙해 지게 되면 많은 분석 기법들을 훨씬 더 잘 이해할 수 있습니다. 하지만 이 사실은 우리 모두 알고있지만 실천하기가 정말 어렵다고 생각을 합니다. 그 실천에 이 책이 도움이 될 것 이라고 생각합니다. 수학과 관련된 책은 굉장히 많이 있지만 제가 느낀 이 책의 장점은 쉽다입니다. 최대한 독자들을 쉽게 이해 시키려는 느낌을 받았습니다. 그렇게 하기 위해 책에서는 그림이랑 표를 예시로 많이 사용하고 있습니다. 또한 책에서는 파이썬, R 두가지의 실습을 제공하고 있습니다. 사람마다 각자 좋아하는 프로그래밍 언어들이 있지만 책에서는 대표적으로 많이 사용되는 두가지 언어의 실습을 제공하고 있어 이 부분이 굉장히 좋았어요. 저도 파이썬을 주로 사용해 왔지만 R코드를 새롭게 알게 되어서 좋았습니다.
1. 좋은 글귀, 마음에 드는 가사 인상 깊은 영화 대사 등을 메모해 주세요. |
2. 출처를 넣어주세요. ex) 234page, 4번 트랙<사랑해>, <브리짓존스의 다이어리>에서 브리짓의 대사 |
책을 읽은 저의 배경을 먼저 설명하자면 문과로써 고등학교 이과 수준의 수학 지식도 전무한 상황. 하지만 현재 개발자를 직업으로 삼고 있으며 열심히 공부하는 사람입니다.
이런 제가 이 책을 읽었을 때 쉽게 다가온다고는 느껴지지는 않았습니다. 물론 앞으로 공부해야할 것들에 대해 알려주는 용도로써 잘 쓰여진 책이라 생각합니다. 또한 파이썬과 R을 실습에 필요한 내용들을 함께 이야기하고 있기는 하지만 사실 이 책에 나와 있는 내용만 가지고는 당연히 부족합니다. 즉 이론을 가볍게 읽고 넘어가길 바라는 이들에게 추천할만 한 책인 것 같습니다. 쉬운 말로 쓰여져 있으나 고등학교 이과 수준의 지식을 가지고 있지 않다면 그마저도 쉽게 다가오지는 않을 것이라 생각합니다.
그러나 분명하게 좋았던 점은 있습니다. 이해하기 힘들었던 개념들이 실제 데이터 분석에 있어서 어떻게 활용되는지 연결되어 설명하는 부분은 정말로 책을 추천할 만한 이유였습니다. 수학만을 공부하고 이것을 어떻게 활용해야할지 모른다면 데이터 분석을 위해 수학을 공부했지만 따로 그러한 개념들을 연결하는데 투자하는 시간도 추가적으로 들 것이라 생각하기 때문입니다.
또 한가지 아쉬운 점을 들자면 코드의 가시성입니다. 다른 여러 책들도 읽어보았지만 가장 코드를 읽기 편한 것은 실제 화면을 캡쳐한 화면입니다. 이 책은 코드와 그 실행 결과를 캡쳐화면이 아닌 책의 텍스트로 보여주다 보니 그 부분에 대해 약간의 아쉬운 점이 있었습니다.
개발 관련 도서 리뷰 이벤트에 당첨돼서 책을 꽁짜로 한권 받게됐다. 그래서 리뷰를 남긴다.
머신러닝에 필요한 수학 분야(선대, 확통, 미적)을 빠르고 가볍게 짚고 넘어갈 수 있다. 따라서 수학을 공부하려고 이 책을 사는 사람은 이 책을 더 깊게 공부하기 위한 발판으로 삼아야 한다. 이 책에서 끝낼 정도로 내용이 깊지가 않다. 책이 얇기 때문에 빠르게 끝내고 다음 공부로 넘어가기는 좋겠다.
대상이 되는 독자에 대한 생각 :
1. 아예 수학과 연이 없고 자신도 없는 사람(입문자) : 추천
2. 이과 계열이라 고등학교에서 수학 공부를 한적이 있거나 혹은 그 이상의 실력 : 이 책의 많은 부분을 이미 알고 있을 가능 성이 높음. 한번 훑어보는 것도 나쁘진 않겠으나 차라리 제대로된 수학 책을 사서 보는게 나을듯.
3. 선대, 확통, 미적을 학교, 학원에서 공부했거나 이미 독학한 사람 : 절대 사지 말 것. 너무 쉽다. 아무리 어설프게 알고 있는 사람이라도, 차라리 어려운 내용에 부딛히면서 실전적으로 익히는게 더 나음.
아래는 그냥 책을 읽다가 떠오르는 걸 마구 적었다.
수학개념을 알려주고, 응용 사례를 넣어주는 것은 정말 좋은 구성이다. 실제 머신러닝쪽에서 쓰이는 알고리즘에서 지금 배운 수학 개념이 어떻게 응용되는지를 보여주는 부분이 있다. 이 책을 읽는 사람은 이후 머신러닝을 공부하기 전에 맛보기를 하는 사람들일 텐데, 미리 여러가지 개념을 접해볼 수 있다는 면에서 좋다.
예를 들어 행렬의 곱셈 개념을 알려주고, 그 이후 사용자 기반 협업 필러팅, 마르코프 체인에서 행렬 곱셈이 어떻게 쓰이는지를 보여주는데, 단순히 개념만이 아니라 다양한 배경지식을 얕고 넓게 쌓을수 있도록 도와주는 점이 마음에 들었다.
조금 과하게 비유를 통해서 개념을 설명해주려는 경향이 가끔 있는데, 이게 너무 과해서 내용이 길어지고 루즈해지는 느낌이 들 때가 있었다. 이 부분은 아예 기초가 전무한 사람에게는 오히려 좋은 부분일수도 있다는 생각도 든다. 읽다보니까 다행히 뒤로 갈수록 그런 부분의 비율이 상당히 적어졌다.
수학적인 설명보다는 직관적으로 설명하는 부분이 많은데, 주 타겟이 입문자라면 납득할만하다.
R 코드는 할 줄 몰라서 안봤고, 파이썬 실습 코드만 봤는데 괜찮다. 수준은 파이썬 왕초보가 봐도 괜찮을 정도니 입문자를 타겟으로 잘 작성됐다. 처음에 파이썬 기본을 알려주기도 해서, 파이썬을 한번이라도 사용해봤다면 보는 데에 지장이 없고, 파이썬을 할줄 모르더라도 지장이 없을수도 있다.
너무 쉽게쉽게 설명하려고 하다보니 간단하게 넘어가는 부분이 있는데 그런 점은 별로다. 예를 들어 역행렬에 대해서 설명할 때 2x2 행렬에 대해서만 역행렬과 determinant를 설명한다. (3x3, nxn도 알려줘!! ) 예시를 든게 저부분인 것이지 이 부분 뿐만이 아니라 많은 예시에서 설명을 할 때 2x2행렬만 사용하는 부분이 약간 아쉬웠다.
전체적으로 미분 파트가 너무 짧고 쉽다. 고등학교 미분 내용에서 크게 벗어나지 않는다. 미분 파트에서 벡터 미분이 하나도 안나와서 매우 아쉬움. 머신러닝 공부하다보면 항상 벡터로/를 미분하는 상황이 오는데, 이 부분에 대한 설명이 거의 없다. 다행히 그라디언트 벡터는 설명해준다. Gradient Descent는 할 수 있겠다.