이미 소장하고 있다면 판매해 보세요.
지은이·옮긴이 소개 3
옮긴이 머리말 4 베타리더 후기 5 이 책을 읽는 방법 9 CHAPTER 1 머신러닝 기초 개념!!! 10 CHAPTER 2 교차검증!!! 23 CHAPTER 3 통계 기초 개념!!! 32 CHAPTER 4 선형회귀!!! 77 CHAPTER 5 경사 하강법!!! 85 CHAPTER 6 로지스틱 회귀!!! 110 CHAPTER 7 나이브 베이즈!!! 122 CHAPTER 8 모델 성능 평가하기!!! 138 CHAPTER 9 정규화로 과적합 방지하기!!! 166 CHAPTER 10 의사결정 트리!!! 185 CHAPTER 11 서포트 벡터 분류기와 서포트 벡터 머신(SVM)!!! 220 CHAPTER 12 신경망!!! 236 부록(학교에서 배웠겠지만 아마도 지금은 잊어버렸을 내용)!!! 273 감사의 말 304 찾아보기 306 |
저조시 스타머
관심작가 알림신청Josh Starmer
역김태헌
관심작가 알림신청김태헌의 다른 상품
문제: 뒤에서 배울 내용이지만 머신러닝에는 분류 혹은 정량 예측을 하기 위한 다양한 방법이 존재합니다. 그렇다면 어떤 방법을 사용할지 어떻게 선택할 수 있을까요? 예를 들어, 이 검은색 직선을 사용해 몸무게로 키를 예측한다고 가정해봅시다. 혹은 이 구불구불한 초록색 곡선으로 몸무게를 기반으로 키를 예측한다고 해봅시다. 검은색 직선과 구불구불한 초록색 곡선 중 어떤 것을 사용해야 할까요? 해답: 머신러닝에서 어떤 방법을 사용할지를 결정한다는 것의 의미는 일반적으로 해당 방법을 시도해보고 성능을 확인한다는 뜻입니다. 예를 들어 이 사람의 몸무게가 이 정도라면… 검은색 직선은 이 사람의 키가 이 정도라고 예측할 것입니다. 이와 반대로, 구불구불한 초록색 곡선은 이 사람의 키가 조금 더 클 것이라 예측하네요.
--- p.14 딥러닝 합성곱 신경망처럼 멋있어 보이는 머신러닝 방법은 매우 많습니다. 그리고 매년 새롭고 흥미로운 방법들이 많이 쏟아지고 있습니다. 하지만 어떤 방법을 사용하든 가장 중요한 점은 테스트 데이터에서 좋은 성능을 내야 한다는 점입니다. BAM!!! 이제 머신러닝에 대한 주요 개념을 몇 가지 살펴보았으니 멋져 보이는 머신러닝 용어 몇 가지를 알아봅시다. 잘 기억해두면 여러분이 댄스 파티에 참석했을 때 똑똑해 보일 수 있을 거예요. --- p.19 앞에서 우리는 이항분포가 3명 중 2명이 호박 파이를 선호할 확률처럼 일련의 이진 결과(binary outcome) 확률을 어떻게 계산하는지 살펴봤습니다. 하지만 다양한 상황에서 사용하는 여러 이산확률분포(discrete probability distribution)가 더 존재합니다. 예를 들어 여러분이 평균적으로 한 시간 동안 이 책을 10페이지 읽을 수 있다고 하면, 푸아송 분포(Poisson distribution)를 사용해 다음 한 시간 동안 8페이지를 읽을 확률을 계산할 수 있습니다. --- p.48 ROC는 수신자 조작 특성(receiver operating characteristic)의 약자입니다. 이 이름은 세계 2차 대전 중 수신된 레이더 신호에서 전투기 신호를 정확하게게 찾기 위해 요약한 그래프에서 유래되었습니다. ROC 그래프는 좋은 분류 임곗값을 찾고자 할 때 큰 도움을 줍니다. ROC 그래프는 참 양성 비율(true positive rate)과 거짓 양성 비율(false positive rate) 관점에서 각 임곗값이 얼마나 좋은 성능을 내는지 한 번에 요약해주기 때문입니다. --- p.154 로지스틱 회귀와 나이브 베이즈 두 모델을 만들어 동일한 데이터로 테스트를 한다고 가정해봅시다. 우리는 어떤 모델의 성능이 더 좋은지 알고 싶습니다. 이론적으로 우리는 각 모델의 ROC 그래프를 비교해볼 수 있을 것입니다. 만약 우리가 비교할 모델이 두 개뿐이라면 이 방법은 아마도 좋은 옵션이 될 수 있겠죠. --- p.160 문제: 선형회귀처럼 신경망에도 데이터에 구불구불한 곡선이나 구부러진 모양의 선을 피팅하기 위해 최적화해야 하는 파라미터가 존재합니다. 이 파라미터들의 최적값을 찾으려면 어떻게 해야 할까요? 해답: 선형회귀처럼 우리는 최적의 파라미터 값을 찾기 위해 경사 하강법 혹은 확률적 경사 하강법을 사용할 수 있습니다. 하지만 우리는 경사 하강법이라 부르지 않겠습니다. 그러면 너무 쉬울 겁니다. 우리는 이를 신경망에서 각 파라미터들의 미분값을 찾는 (뒤에서 앞으로 가는) 방법에서 유래한 역전파라 부르겠습니다. BAM!!! --- p.255 |
요약된 글보다 쉽게 머신러닝을 이해하는 혁신적인 방식
처음 접하는 머신러닝의 개념과 용어를 확실히 이해하고 싶다. 하지만 보기만 해도 머리 아프고 두꺼운 머신러닝 책은 선뜻 손이 가지 않는다. 이제 그러한 책들은 나중으로 미뤄두자. 이 책에서 재미있는 예시를 포함한 그림을 따라가다 보면 쉬우면서도 확실하게 머신러닝 기본기를 다질 수 있으니 말이다. 머신러닝 입문서로서 과연 이만한 책이 있을까. 머신러닝은 1도 모르는 사람도 내용에 빠져들어 읽다 보면 금세 이해하게 될 것이다. 저자의 유머와 명쾌한 해답, 이해를 도와주는 노말사우르스와 스탯스콰치가 아주 기초적인 내용부터 신경망 같은 고급 주제까지 이끌어준다. 이 책의 저자 조시 스타머는 개념을 글로 요약하는 대신 혁신적인 StatQuest 방식을 만들어 전 세계 사람들이 데이터 과학 대회에서 우승하고, 시험을 통과하고, 학교를 졸업하고, 직업을 얻고 승진하는 데 도움을 주고 있다. 독자 여러분도 그중 한 명이 되기를 간절히 바란다. 베타리더의 한마디를 인용해 서평을 마무리하겠다. “앞으로 이 책을 모르는 사람이 없었으면 좋겠다.” 주요 내용 ■ 머신러닝 기초 개념!!! ■ 교차검증!!! ■ 통계 기초 개념!!! ■ 선형회귀!!! ■ 경사 하강법!!! ■ 로지스틱 회귀!!! ■ 나이브 베이즈!!! ■ 모델 성능 평가하기!!! ■ 정규화로 과적합 방지하기!!! ■ 의사결정 트리!!! ■ 서포트 벡터 분류기와 서포트 벡터 머신!!! ■ 신경망!!! |