확장메뉴
주요메뉴


소득공제
미리보기 공유하기

선형대수와 통계학으로 배우는 머신러닝 with 파이썬

: 최적화 개념부터 텐서플로를 활용한 딥러닝까지

리뷰 총점9.2 리뷰 10건 | 판매지수 5,802
베스트
IT 모바일 top100 6주
명화를 담은 커피, 가을을 닮은 책 - 명화 드립백/명화 캡슐 커피/명화 내열 유리컵+드립백 세트/매거진 랙
[IT 기획전] IT, 모두의 교양
9월의 얼리리더 주목신간 : 웰컴 투 북월드 배지 증정
[대학생X취준생] 꼭 공부를 해야 할 상황이라면? 2학기, 공부할 결심!
박해선 저자의 머신러닝/딥러닝 패스
[단독]『혼자 공부하는 파이썬』 개정판 출간
내일은 개발자! 코딩테스트 대비 도서전
[단독] 에듀윌 IT 자격증 기획전 - 가장 빠른 합격출구 EXIT
소장가치 100% YES24 단독 판매 상품
YES24 트윈링 분철 : 인서트라벨/스티커 택1 증정
9월 전사
쇼핑혜택
1 2 3 4 5

품목정보

품목정보
출간일 2021년 01월 26일
쪽수, 무게, 크기 624쪽 | 1190g | 188*245mm
ISBN13 9791165920395
ISBN10 1165920395

이 상품의 태그

책소개 책소개 보이기/감추기

머신러닝에 필요한 선형대수, 통계학, 최적화 이론부터
파이썬, 사이킷런, 텐서플로를 활용한 실습까지


『선형대수와 통계학으로 배우는 머신러닝 with 파이썬』은 머신러닝의 기본적인 사용 방법뿐만 아니라 통계학, 선형대수, 최적화 이론 등 머신러닝에 필요한 배경 이론까지 다룬다. 머신러닝 알고리즘을 소개하는 것에 그치지 않고 이론적으로 이해가 필요한 부분은 수학 수식을 통해 자세히 설명함으로써, 해당 머신러닝 알고리즘의 작동 방식을 파악할 수 있다.
프로그래밍 실습은 머신러닝 파트에서는 사이킷런 라이브러리를, 딥러닝 파트에서는 텐서플로 라이브러리를 사용한다. 각 코드의 라인별 부가 설명을 통해 해당 코드의 역할을 이해할 수 있으며, 각 장 마지막의 전체 코드로 전체 흐름 또한 파악할 수 있다.
머신러닝의 배경 이론 이해를 바탕으로 실습하는 이 책을 통해, 머신러닝 기본기를 다지는 것을 넘어 자신의 분야에 응용할 수 있을 것이다.

이 책의 특징
- 머신러닝 수학 수식 전개 과정을 상세히 표현한다.
- 머신러닝 알고리즘 개념을 쉬운 그림으로 알기 쉽게 설명한다.
- 복잡한 수학 수식과 프로그래밍 코드를 자세하게 설명한다.

이 책이 필요한 독자
- 머신러닝 분야에 관심이 있고 머신러닝을 배우고 싶은 분
- 머신러닝을 공부한 경험이 있지만 실제 사용에 어려움을 느끼는 분
- 머신러닝 알고리즘의 원리를 이해하고 싶은 분

목차 목차 보이기/감추기

■ CHAPTER 1. 환경 설정
1.1 윈도우에서 환경 설정하기
1.2 맥북에서 환경 설정하기
1.3 리눅스에서 환경 설정하기

■ CHAPTER 2. 머신러닝 개요
2.1 머신러닝이란
2.2 지도 학습 vs 비지도 학습
2.3 머신러닝의 전반적인 과정

■ CHAPTER 3. 머신러닝을 위한 선형대수
3.1 선형대수와 머신러닝의 관계
3.2 행렬의 기초
___ 3.2.1 행렬이란
___ 3.2.2 대각 행렬
___ 3.2.3 전치 행렬
___ 3.2.4 행렬의 덧셈, 뺄셈
___ 3.2.5 행렬의 스칼라곱
___ 3.2.6 행렬곱
___ 3.2.7 행렬의 원소곱
___ 3.2.8 행렬식
___ 3.2.9 역행렬
3.3 내적
3.4 선형 변환
3.5 랭크, 차원
___ 3.5.1 벡터 공간, 기저
___ 3.5.2 랭크와 차원
___ 3.5.3 직교 행렬
3.6 고윳값, 고유 벡터
3.7 특이값 분해
___ 3.7.1 닮음
___ 3.7.2 직교 대각화
___ 3.7.3 고윳값 분해
___ 3.7.4 특이값 분해
3.8 이차식 표현
___ 3.8.1 이차식 개념
___ 3.8.2 양정치 행렬
3.9 벡터의 미분

■ CHAPTER 4. 머신러닝을 위한 통계학
4.1 통계학과 머신러닝의 관계
4.2 확률 변수와 확률 분포
___ 4.2.1 확률 변수
___ 4.2.2 확률 분포
4.3 모집단과 표본
4.4 평균과 분산
___ 4.4.1 평균
___ 4.4.2 분산
___ 4.4.3 평균과 분산의 성질
4.5 상관관계
___ 4.5.1 공분산
___ 4.5.2 상관 계수
4.6 균일 분포
4.7 정규 분포
4.8 이항 분포
___ 4.8.1 베르누이 분포
___ 4.8.2 이항 분포
___ 4.8.3 다항 분포
4.9 최대 가능도 추정
4.10 최대 사후 추정
___ 4.10.1 조건부 확률
___ 4.10.2 베이즈 추정
___ 4.10.3 최대 사후 추정

■ CHAPTER 5. 최적화
5.1 컨벡스 셋
___ 5.1.1 직선과 선분
___ 5.1.2 아핀 셋
___ 5.1.3 아핀 함수 vs 선형 함수
___ 5.1.4 컨벡스 셋
___ 5.1.5 초평면과 반공간
5.2 컨벡스 함수
___ 5.2.1 컨벡스 함수의 개념
___ 5.2.2 컨벡스 함수의 예
___ 5.2.3 1차, 2차 미분 조건
___ 5.2.4 얀센의 부등식
___ 5.2.5 컨벡스 성질 보존 조건
5.3 라그랑주 프리멀 함수
___ 5.3.1 일반적인 최적화 문제
___ 5.3.2 컨벡스 최적화 문제
___ 5.3.3 라그랑주 프리멀 함수
5.4 라그랑주 듀얼 함수
5.5 Karush-Kuhn-Tucker(KKT) 조건
5.6 머신러닝에서의 최적화 문제
___ 5.6.1 최소 제곱법
___ 5.6.2 제약식이 포함된 최소 제곱법
5.7 뉴턴-랩슨 메소드
5.8 그래디언트 디센트 옵티마이저
___ 5.8.1 그래디언트 디센트 소개
___ 5.8.2 확률적 그래디언트 디센트
___ 5.8.3 모멘텀
___ 5.8.4 네스테로프 가속 경사(Nesterov Accelerated Gradient)
___ 5.8.5 Adagrad
___ 5.8.6 Adadelta
___ 5.8.7 RMSprop
___ 5.8.8 Adam
___ 5.8.9 AdaMax
___ 5.8.10 Nadam

■ CHAPTER 6. 머신러닝 데이터 살펴보기
6.1 머신러닝에 사용할 데이터 소개
___ 6.1.1 집값 예측하기
___ 6.1.2 꽃 구분하기
___ 6.1.3 와인 구분하기
___ 6.1.4 당뇨병 예측하기
___ 6.1.5 유방암 예측하기
6.2 데이터 전처리
___ 6.2.1 결측치 처리
___ 6.2.2 클래스 라벨 설정
___ 6.2.3 원-핫 인코딩
___ 6.2.4 데이터 스케일링

■ CHAPTER 7. 모형 평가
7.1 오버피팅과 언더피팅
7.2 크로스-밸리데이션
7.3 파이프라인
7.4 그리드 서치
7.5 손실 함수와 비용 함수
___ 7.5.1 손실 함수와 비용 함수의 개념
___ 7.5.2 L1 손실 함수
___ 7.5.3 L2 손실 함수
___ 7.5.4 엔트로피
___ 7.5.5 Negative Log Likelihood(NLL)
7.6 모형 성능 평가
___ 7.6.1 모형 성능 평가에 필요한 개념
___ 7.6.2 분류 문제에서의 성능 평가
___ 7.6.3 회귀 문제에서의 성능 평가
___ 7.6.4 군집 문제에서의 성능 평가

■ CHAPTER 8. 지도 학습
8.1 지도 학습 개요
8.2 사이킷런 소개
8.3 k-최근접 이웃 알고리즘
___ 8.3.1 k-최근접 이웃 알고리즘의 개념
___ 8.3.2 k-최근접 이웃 실습
8.4 선형 회귀 분석
___ 8.4.1 선형 회귀 분석의 개념
___ 8.4.2 릿지 회귀 분석(L2 제약식)
___ 8.4.3 라쏘 회귀 분석(L1 제약식)
___ 8.4.4 엘라스틱 넷
___ 8.4.5 선형 회귀 분석 실습
8.5 로지스틱 회귀 분석
___ 8.5.1 로지스틱 회귀 분석의 개념
___ 8.5.2 로지스틱 회귀 분석 실습
8.6 나이브 베이즈
___ 8.6.1 나이브 베이즈의 개념
___ 8.6.2 나이브 베이즈 실습
8.7 의사 결정 나무
___ 8.7.1 의사 결정 나무의 개념
___ 8.7.2 엔트로피
___ 8.7.3 지니 계수
___ 8.7.4 회귀 나무
___ 8.7.5 의사 결정 나무 실습
8.8 서포트 벡터 머신
___ 8.8.1 서포트 벡터 머신의 개념
___ 8.8.2 소프트 마진
___ 8.8.3 커널 서포트 벡터 머신
___ 8.8.4 서포트 벡터 회귀
___ 8.8.5 서포트 벡터 머신 실습
8.9 크로스 밸리데이션 실습

■ CHAPTER 9. 앙상블 학습
9.1 앙상블 학습 개념
9.2 보팅
___ 9.2.1 보팅의 개념
___ 9.2.2 보팅 실습
9.3 배깅과 랜덤 포레스트
___ 9.3.1 독립적 앙상블 방법
___ 9.3.2 배깅과 랜덤 포레스트의 개념
___ 9.3.3 랜덤 포레스트 실습
___ 9.3.4 배깅 실습
9.4 부스팅
___ 9.4.1 의존적 앙상블 방법
___ 9.4.2 에이다 부스트 개념 설명
___ 9.4.3 에이다 부스트 실습
___ 9.4.4 그래디언트 부스팅 개념 설명
___ 9.4.5 그래디언트 부스팅 실습
9.5 스태킹
___ 9.5.1 스태킹의 개념
___ 9.5.2 스태킹 실습

■ CHAPTER 10. 차원 축소
10.1 차원 축소 개념
___ 10.1.1 차원 축소하는 이유
___ 10.1.2 차원의 저주
10.2 주성분 분석
___ 10.2.1 주성분 분석의 개념
___ 10.2.2 주성분 분석 실습
10.3 커널 PCA
___ 10.3.1 커널 PCA의 개념
___ 10.3.2 커널 PCA 실습
10.4 LDA
___ 10.4.1 LDA의 개념
___ 10.4.2 LDA의 이론적 배경
___ 10.4.3 LDA 실습
10.5 LLE
___ 10.5.1 LLE의 개념
___ 10.5.2 LLE 실습
10.6 비음수 행렬 분해
___ 10.6.1 비음수 행렬 분해의 개념
___ 10.6.2 비용 함수
___ 10.6.3 비음수 행렬 분해 실습

■ CHAPTER 11. 비지도 학습
11.1 비지도 학습 개요
11.2 K-평균 클러스터링
___ 11.2.1 K-평균 클러스터링의 개념
___ 11.2.2 K-평균 클러스터링 실습
11.3 계층 클러스터링
___ 11.3.1 계층 클러스터링의 개념
___ 11.3.2 단일 연결
___ 11.3.3 완전 연결
___ 11.3.4 Ward’s 계층 클러스터링
___ 11.3.5 계층 클러스터링 실습
11.4 DBSCAN
___ 11.4.1 DBSCAN의 개념
___ 11.4.2 DBSCAN 알고리즘
___ 11.4.3 DBSCAN 실습
11.5 가우시안 혼합 모형
___ 11.5.1 가우시안 혼합 모형의 개념 설명
___ 11.5.2 EM 알고리즘
___ 11.5.3 가우시안 혼합 모형 실습

■ CHAPTER 12. 딥러닝
12.1 딥러닝 소개
12.2 퍼셉트론, 딥러닝의 기본
___ 12.2.1 퍼셉트론의 개념
___ 12.2.2 퍼셉트론으로 분류하기
___ 12.2.3 퍼셉트론 실습
12.3 인공 신경망으로 하는 딥러닝
___ 12.3.1 신경망의 개념
___ 12.3.2 오차 역전파
___ 12.3.3 활성화 함수
___ 12.3.4 배치 정규화
___ 12.3.5 드롭아웃
___ 12.3.6 텐서플로 2.0 소개
___ 12.3.7 분류 신경망 실습
___ 12.3.8 회귀 신경망 실습
12.4 합성곱 신경망(CNN)
___ 12.4.1 합성곱 신경망의 개념
___ 12.4.2 패딩
___ 12.4.3 스트라이드
___ 12.4.4 풀링
___ 12.4.5 고차원 데이터 합성곱
___ 12.4.6 합성곱 신경망 실습
12.5 순환 신경망(RNN)
___ 12.5.1 순환 신경망의 개념
___ 12.5.2 LSTM
___ 12.5.3 GRU
___ 12.5.4 순환 신경망 실습
12.6 오토 인코더(Auto-Encoder)
___ 12.6.1 오토 인코더 개념
___ 12.6.2 오토 인코더 실습
12.7 자연어 처리
___ 12.7.1 단어의 토큰화
___ 12.7.2 단어를 벡터로 변환
___ 12.7.3 단어 임베딩
___ 12.7.4 seq2seq 모형
___ 12.7.5 어텐션
___ 12.7.6 자연어 처리 실습
12.8 적대적 생성 신경망(GAN)
___ 12.8.1 적대적 생성 신경망의 개념
___ 12.8.2 적대적 생성 신경망 알고리즘
___ 12.8.3 적대적 생성 신경망 실습

저자 소개 (1명)

출판사 리뷰 출판사 리뷰 보이기/감추기

머신러닝과 필연적 관계인 ‘수학’
수식이 어려운 당신에게 꼭 필요한 책!


머신러닝을 이해하기 위해서는 머신러닝을 근본적으로 떠받치고 있는 선형대수와 통계학, 최적화 개념에서부터 출발해야 한다. 『선형대수와 통계학으로 배우는 머신러닝 with 파이썬』은 이러한 개념을 다룰 때 수식 표현을 사용하고 코드보다 수학적인 지식을 먼저 서술함으로써, 머신러닝 알고리즘마다 원리를 이해하는 것을 목적으로 한다. 또한 ‘책에 쓰인 수학 기호’를 정리한 표를 통해 수식 이해에 어려움을 느끼는 독자의 진입 장벽을 낮추었다. 따라서 선형대수나 통계학에 대한 지식이 부족한 분들도 수학적 원리를 이해하며 기초를 탄탄히 쌓기에 큰 도움이 될 것이다.

소스 코드 다운로드
https://github.com/bjpublic/MachineLearning

베타리더의 한 마디
내가 공부할 때도 이런 책이 있었으면 그렇게 헤매지 않았을 텐데! 이 책을 통해 데이터 과학이라는 이름 아래에 모인 여러 학문에서 나온 지식의 연관성을 구체적으로 알 수 있습니다. _김민성 님

머신러닝을 공부하고 싶었지만, 수학적 기초 때문에 망설였던 분들이나 알고리즘에 사용되는 상세한 내용이 궁금한 분들에게 큰 도움이 될 것입니다. _류회성 님

책을 읽으면서 5년만 젊었으면 좋겠다는 생각이 들었습니다. 5년간의 박사과정에서 필요했던 지식이 모두 담겨 있습니다. 어색한 번역 투의 글이 아닌 한국어책이 나온 건 생명정보학 전공자로서 매우 기쁜 일입니다. _오세진 님

이 책을 읽으면서 인공지능의 기본이 되는 수학과 통계학에 무지한 상태로 학습을 이어 갔었다는 자기반성을 하게 되었습니다. 수학적인 원리 이해에 어려움을 겪고 있는 많은 분에게 필요한 책입니다. _이진 님

이 책은 자신의 전문 분야에 대한 연구 또는 업무 능력을 한 단계 높여 줄 것입니다. 머신러닝이 익숙하지 않은 분도 통계학을 통해 머신러닝을 더욱 잘 이해하는 계기가 될 것입니다. _이현훈 님

회원리뷰 (10건) 리뷰 총점9.2

혜택 및 유의사항?
구매 선형대수와 통계학으로 배우는 머신러닝 with 파이썬 내용 평점5점   편집/디자인 평점5점 h*******6 | 2022.04.06 | 추천0 | 댓글0 리뷰제목
선형대수와 통계학으로 배우는 머신러닝 with 파이썬 리뷰입니다 리뷰 이벤트에 참여합니다ㅎㅎㅎ 비제이퍼블릭에서 2021년 1월에 출간되었습니다 장철원 작가님의 책은 처음 접했는데요 잘읽었습니다ㅎㅎㅎ 표지가 아주 이쁘네요 맘에듭니다 사실 끝까지 읽진 못했습니다 인기가 좋아서 구입했습니다 ㅋ 다음에 다시 볼것같아요...;
리뷰제목

선형대수와 통계학으로 배우는 머신러닝 with 파이썬 리뷰입니다

리뷰 이벤트에 참여합니다ㅎㅎㅎ

비제이퍼블릭에서 2021년 1월에 출간되었습니다

장철원 작가님의 책은 처음 접했는데요

잘읽었습니다ㅎㅎㅎ

표지가 아주 이쁘네요 맘에듭니다

사실 끝까지 읽진 못했습니다

인기가 좋아서 구입했습니다 ㅋ

다음에 다시 볼것같아요...

아마도...ㅎㅎㅎㅎ

댓글 0 이 리뷰가 도움이 되었나요? 공감 0
구매 내용이 너무 부실해요. 내용 평점2점   편집/디자인 평점2점 w*******4 | 2022.03.13 | 추천2 | 댓글0 리뷰제목
책 한권에 너무 많은 내용을 담을려고 하다보니 내용이 너무 부실합니다.이론의 이유와 해석은 거의 없고 결과만 알려주는 형식이라 중요한 부분이 많이 빠진거 같아요.검색이나 다른 자료를 통해서 부족한 부분을 보충하면서 공부하고 있습니다.그래서 이 책은 공부를 어떤 순서로 해야 하는지 참고용으로 쓰고 있어요.아쉬움이 많은 책인거 같아요..............;
리뷰제목
책 한권에 너무 많은 내용을 담을려고 하다보니 내용이 너무 부실합니다.
이론의 이유와 해석은 거의 없고 결과만 알려주는 형식이라 중요한 부분이 많이 빠진거 같아요.
검색이나 다른 자료를 통해서 부족한 부분을 보충하면서 공부하고 있습니다.
그래서 이 책은 공부를 어떤 순서로 해야 하는지 참고용으로 쓰고 있어요.
아쉬움이 많은 책인거 같아요..............
댓글 0 2명이 이 리뷰를 추천합니다. 공감 2
구매 좋은데 아쉬운 책 내용 평점5점   편집/디자인 평점3점 YES마니아 : 로얄 p********n | 2021.03.08 | 추천3 | 댓글1 리뷰제목
현재까지 모든 리뷰가 만점을 주고 있지만, 개인적으로 아쉬운 부분이 많은 책이다. 먼저 책의 앞부분에서 수학과 통계 관련 부분을 간략하게 다루고 넘어가는데, 이 부분이 은근히 부실한 느낌이다.  물론 방대한 내용을 요약하느라 건너뛰는 부분이 많다는 점을 충분히 이해하지만, 서문에 밝힌 것처럼 '수식에 익숙하지 않은 독자들도 충분히 이해할 수 있도록'이라는 목적은;
리뷰제목

현재까지 모든 리뷰가 만점을 주고 있지만, 개인적으로 아쉬운 부분이 많은 책이다.

먼저 책의 앞부분에서 수학과 통계 관련 부분을 간략하게 다루고 넘어가는데, 이 부분이 은근히 부실한 느낌이다. 

물론 방대한 내용을 요약하느라 건너뛰는 부분이 많다는 점을 충분히 이해하지만, 서문에 밝힌 것처럼 '수식에 익숙하지 않은 독자들도 충분히 이해할 수 있도록'이라는 목적은 달성하지 못할 것이라고 생각한다. 

리뷰를 작성하는 본인은 수학에 완전히 문외한은 아니고 나름대로 통계 응용분야를 전공한 사람인데도 중간중간 붕 뜬 느낌을 받았다. 한마디로 관련 지식들을 쉽게 설명하려는 노력은 보이지만, 그 지식들이 유기적으로 잘 연결되었다는 느낌은 들지 않는다.

그보다는 '머신러닝에 필요한 수학적 지식은 어떤 것들인지'를 나열식으로 제시하는 느낌이고, 독자가 필요로 한다면 추가로 찾아서 공부하기에 좋은 구성이다. 

이러한 구성이 특별히 단점이라고는 생각하지 않는다. 다만 저자 서문에서 '수식에 익숙하지 않은 독자들'을 대상으로 한다고 서술하였으므로, 그 부분을 원해서 구입한 독자라면 다소 실망할 수 있다. 차라리 현재 구성에서 추가로 공부할 수 있는 소스 등을 덧붙였다면 훨씬 유용하지 않았을까 싶다.

 

두 번째는 편집상의 오류나 오탈자와 관련된 부분이다. 

책의 내용이 진행되면서 필요한 코드가 충분히 제시되어 있기는 한데, 그 코드에 오류가 은근히 자주 보이는 편이다. 예를 들어 135쪽 dic_y를 빈 딕셔너리로 정의하는 코드에서 'dic_y = ' 까지만 제시하고 있는데 실제로 이를 실행하면 오류가 발생한다. 빈 딕셔너리를 정의하려면 'dic_y = {}'와 같이 작성해야 하기 때문이다. 이외에도 데이터프레임을 복사하면서 copy 함수를 사용하지 않아 원본 데이터프레임까지 함께 변해 혼란을 유발한다는 점이나, 코드의 일관성 차원에서 대/소문자를 혼용하거나 공백을 비일관적으로 사용하는 점, 가끔 실제 아웃풋이 책에 제시된 아웃풋과 다르게 나타나는 점 등은 상당히 아쉬운 부분이다. 

만약 파이썬을 처음 접하는 독자가 책에 있는 코드대로 따라하다 보면 많은 혼란을 느낄 것 같다. 편집 과정에서 좀더 꼼꼼하게 확인했어야 하는 부분이 아닌가 싶다. 개정판이 출간된다면 꼭 개선되었으면 한다.

 

이러한 아쉬움을 제외하면 방대한 내용을 꽤나 잘 정리한 책이라고 생각한다. 시판되고 있는 머신러닝 서적 중에서는 나름대로 진지한 톤으로 접근하고 있다는 점도 매우 마음에 든다. 

개인적으로는 입문용 서적을 접한 후 더 공부하고 싶은데 어디서부터 접근해야 할지 모르겠다는 사람들이 이 책을 공부한다면 좋을 것이라고 생각한다.

댓글 1 3명이 이 리뷰를 추천합니다. 공감 3

한줄평 (4건) 한줄평 총점 9.6

혜택 및 유의사항 ?
구매 평점4점
잘읽었습니다
이 한줄평이 도움이 되었나요? 공감 0
h*******6 | 2022.04.06
구매 평점5점
아들이 공부하려고 구매했어요.
이 한줄평이 도움이 되었나요? 공감 0
YES마니아 : 골드 1****j | 2022.02.05
구매 평점5점
오히려 수학에 관심이 많을수록 좋은책입니다. 군대 안에서 재밌게 했습니다.
이 한줄평이 도움이 되었나요? 공감 0
미**관 | 2021.10.26
  •  쿠폰은 결제 시 적용해 주세요.
1   33,750
뒤로 앞으로 맨위로 aniAlarm