이미 소장하고 있다면 판매해 보세요.
CHAPTER 1 소개
1.1 왜 머신러닝인가? __1.1.1 머신러닝으로 풀 수 있는 문제 __1.1.2 문제와 데이터 이해하기 1.2 왜 파이썬인가? 1.3 scikit-learn __1.3.1 scikit-learn 설치 1.4 필수 라이브러리와 도구들 __1.4.1 주피터 노트북 __1.4.2 NumPy __1.4.3 SciPy __1.4.4 matplotlib __1.4.5 pandas __1.4.6 mglearn 1.5 파이썬 2 vs. 파이썬 3 1.6 이 책에서 사용하는 소프트웨어 버전 1.7 첫 번째 애플리케이션: 붓꽃의 품종 분류 __1.7.1 데이터 적재 __1.7.2 성과 측정: 훈련 데이터와 테스트 데이터 __1.7.3 가장 먼저 할 일: 데이터 살펴보기 __1.7.4 첫 번째 머신러닝 모델: k-최근접 이웃 알고리즘 __1.7.5 예측하기 __1.7.6 모델 평가하기 1.8 요약 및 정리 CHAPTER 2 지도 학습 2.1 분류와 회귀 2.2 일반화, 과대적합, 과소적합 __2.2.1 모델 복잡도와 데이터셋 크기의 관계 2.3 지도 학습 알고리즘 __2.3.1 예제에 사용할 데이터셋 __2.3.2 k-최근접 이웃 __2.3.3 선형 모델 __2.3.4 나이브 베이즈 분류기 __2.3.5 결정 트리 __2.3.6 결정 트리의 앙상블 __2.3.7 (한국어판 부록) 배깅, 엑스트라 트리, 에이다부스트 __2.3.8 커널 서포트 벡터 머신 __2.3.9 신경망(딥러닝) 2.4 분류 예측의 불확실성 추정 __2.4.1 결정 함수 __2.4.2 예측 확률 __2.4.3 다중 분류에서의 불확실성 2.5 요약 및 정리 CHAPTER 3 비지도 학습과 데이터 전처리 3.1 비지도 학습의 종류 3.2 비지도 학습의 도전 과제 3.3 데이터 전처리와 스케일 조정 __3.3.1 여러 가지 전처리 방법 __3.3.2 데이터 변환 적용하기 __3.3.3 (한국어판 부록) QuantileTransformer와 PowerTransformer __3.3.4 훈련 데이터와 테스트 데이터의 스케일을 같은 방법으로 조정하기 __3.3.5 지도 학습에서 데이터 전처리 효과 3.4 차원 축소, 특성 추출, 매니폴드 학습 __3.4.1 주성분 분석(PCA) __3.4.2 비음수 행렬 분해(NMF) __3.4.3 t-SNE를 이용한 매니폴드 학습 3.5 군집 __3.5.1 k-평균 군집 __3.5.2 병합 군집 __3.5.3 DBSCAN __3.5.4 군집 알고리즘의 비교와 평가 __3.5.5 군집 알고리즘 요약 3.6 요약 및 정리 CHAPTER 4 데이터 표현과 특성 공학 4.1 범주형 변수 __4.1.1 원-핫-인코딩(가변수) __4.1.2 숫자로 표현된 범주형 특성 4.2 OneHotEncoder와 ColumnTransformer: scikit-learn으로 범주형 변수 다루기 4.3 make_column_transformer로 간편하게 ColumnTransformer 만들기 4.4 구간 분할, 이산화 그리고 선형 모델, 트리 모델 4.5 상호작용과 다항식 4.6 일변량 비선형 변환 4.7 특성 자동 선택 __4.7.1 일변량 통계 __4.7.2 모델 기반 특성 선택 __4.7.3 반복적 특성 선택 4.8 전문가 지식 활용 4.9 요약 및 정리 CHAPTER 5 모델 평가와 성능 향상 5.1 교차 검증 __5.1.1 scikit-learn의 교차 검증 __5.1.2 교차 검증의 장점 __5.1.3 계층별 k-겹 교차 검증과 그외 전략들 __5.1.4 (한국어판 부록) 반복 교차 검증 5.2 그리드 서치 __5.2.1 간단한 그리드 서치 __5.2.2 매개변수 과대적합과 검증 세트 __5.2.3 교차 검증을 사용한 그리드 서치 5.3 평가 지표와 측정 __5.3.1 최종 목표를 기억하라 __5.3.2 이진 분류의 평가 지표 __5.3.3 다중 분류의 평가 지표 __5.3.4 회귀의 평가 지표 __5.3.5 모델 선택에서 평가 지표 사용하기 5.4 요약 및 정리 CHAPTER 6 알고리즘 체인과 파이프라인 6.1 데이터 전처리와 매개변수 선택 6.2 파이프라인 구축하기 6.3 그리드 서치에 파이프라인 적용하기 6.4 파이프라인 인터페이스 __6.4.1 make_pipleline을 사용한 파이프라인 생성 __6.4.2 단계 속성에 접근하기 __6.4.3 그리드 서치 안의 파이프라인 속성에 접근하기 6.5 전처리와 모델의 매개변수를 위한 그리드 서치 6.6 모델 선택을 위한 그리드 서치 __6.6.1 중복 계산 피하기 6.7 요약 및 정리 CHAPTER 7 텍스트 데이터 다루기 7.1 문자열 데이터 타입 7.2 예제 애플리케이션: 영화 리뷰 감성 분석 7.3 텍스트 데이터를 BOW로 표현하기 __7.3.1 샘플 데이터에 BOW 적용하기 __7.3.2 영화 리뷰에 대한 BOW 7.4 불용어 7.5 tf-idf로 데이터 스케일 변경하기 7.6 모델 계수 조사 7.7 여러 단어로 만든 BOW(n-그램) 7.8 고급 토큰화, 어간 추출, 표제어 추출 __7.8.1 (한국어판 부록) KoNLPy를 사용한 영화 리뷰 분석 7.9 토픽 모델링과 문서 군집화 __7.9.1 LDA 7.10 요약 및 정리 CHAPTER 8 마무리 8.1 머신러닝 문제 접근 방법 __8.1.1 의사 결정 참여 8.2 프로토타입에서 제품까지 8.3 제품 시스템 테스트 8.4 나만의 추정기 만들기 8.5 더 배울 것들 __8.5.1 이론 __8.5.2 다른 머신러닝 프레임워크와 패키지 __8.5.3 랭킹, 추천 시스템과 그 외 다른 알고리즘 __8.5.4 확률 모델링, 추론, 확률적 프로그래밍 __8.5.5 신경망 __8.5.6 대규모 데이터셋으로 확장 __8.5.7 실력 기르기 8.6 마치며 |
Andreas Mueller
Sarah Guido
박해선의 다른 상품
안녕하세요 이 책의 역자입니다.
2022-02-24
안녕하세요. “파이썬 라이브러리를 활용한 머신러닝(번역개정2판)”을 번역한 박해선입니다. 이 책을 선택해 주신 많은 독자에게 진심으로 감사의 말씀 드립니다. 개정2판은 사이킷런 1.x 릴리스에 맞춰 최신 변경 사항과 추가된 기능을 담았습니다. 이 책은 사이킷런(Scikit-Learn) 라이브러리를 사용하여 머신러닝 작업의 파이프라인 전반을 학습할 수 있도록 구성되어 있습니다. 지도학습, 비지도학습, 분류, 회귀, 텍스트 분석, 특성공학, 교차검증, 그리드서치, 평가 등의 주제를 알차게 담고 있습니다. 복잡할 수 있는 머신러닝 개념을 사이킷런의 핵심 개발자이자 릴리스 매니저인 안드레아스가 명쾌하게 설명합니다. 책을 읽는 시간이 결코 아깝지 않을 것입니다. 이 책을 통해 머신러닝의 큰 그림을 그려보세요! 책을 구매하시면 제 블로그의 에러타 페이지(https://bit.ly/python-ml-home)와 깃허브(https://bit.ly/python-ml-git)를 꼭 참고해 주세요. 항상 사이킷런 최신 버전에 맞춘 코드와 에러타를 업데이트 하겠습니다. [머신러닝 파워드 애플리케이션], [파이토치로 배우는 자연어 처리], [머신러닝 교과서 3판], [딥러닝 일러스트레이티드], [혼자 공부하는 머신러닝+딥러닝], [GAN 인 액션], [핸즈온 머신러닝 2], [미술관에 GAN 딥러닝], [Do It! 딥러닝 입문], [파이썬을 활용한 머신러닝 쿡북], [케라스 창시자에게 배우는 딥러닝] 등에 이어 열 일곱 번째 머신러닝 책입니다. 많은 분들의 응원 덕에 큰 힘을 얻습니다. 더 좋은 책으로 찾아 뵙겠습니다. 감사합니다.
|
실제 문제에 대한 해법을 찾는 머신러닝 기술자를 위한 본격 머신러닝 입문서
사이킷런 1.x 버전을 반영하고 구글 코랩에서 실습 가능한 번역개정2판 이 책은 머신러닝 알고리즘을 밑바닥부터 만드는 법을 다루지는 ‘않으며’, 대신 사이킷런과 다른 라이브러리에 이미 구현된 방대한 양의 모델을 사용하는 법에 집중합니다. 머신러닝과 인공지능에 대한 사전 지식이 필요 없는 입문서로, 파이썬과 사이킷런을 중심으로 머신러닝 애플리케이션을 성공적으로 만드는 모든 단계를 밟아갑니다. 여기서 소개하는 방법들은 상용 애플리케이션을 만드는 데이터 전문가는 물론 연구자와 과학자에게도 도움이 될 것입니다. 파이썬과 NumPy, matplotlib 라이브러리에 친숙하다면 이 책의 대부분을 이해할 수 있습니다. ★ 번역개정2판의 특징 본 번역개정판은 원서 4쇄를 기반으로 하며, 초판 발행 이후 알려진 오탈자를 모두 바로잡았습니다. 또한 scikit-learn 1.x 버전 릴리스에 따라 전반적으로 내용을 업데이트했습니다. 나아가 구글 코랩에서 실습이 가능하도록 전반적으로 수정했습니다. ★ 주요 내용 ● 머신러닝의 기본 개념과 응용 ● 널리 사용되는 머신러닝 알고리즘의 장점과 단점 ● 머신러닝으로 처리한 데이터를 표현하는 방법 ● 모델 평가와 매개변수 튜닝을 위한 고급 방법 ● 체인 모델과 워크플로 캡슐화를 위한 파이프라인 ● 텍스트 데이터를 다루는 기술 ● 머신러닝과 데이터 과학 기술 향상을 위한 조언 |
이 책은 사이킷런이 제공하는 핵심 알고리즘들의 사용법을 알려줍니다. 여기에 정성 가득한 역자주까지 더해져서, 머신러닝에 입문하는 파이썬 개발자에게는 더할 나위 없는 선물입니다.
- 오동권 (니트머스 CTO) |
이 책은 복잡한 수식은 걷어내고 사이킷런을 기반으로 각 머신러닝 알고리즘의 원리와 구현 방법을 다양한 예제로 설명합니다. 약간의 프로그래밍 지식만 있다면 복잡한 이론적 배경 없이도 혼자 학습하기 좋은 책입니다. - 이상훈 (삼성생명 DA Lab ‘한국 스파크 사용자 모임’ 운영자, 『실시간 분석의 모든 것』 역자)
|
머신러닝 시장을 선도하는 라이브러리의 핵심 개발자가 쓰고, ‘텐서플로 코리아 그룹’에서 한국 인공지능 개발자들을 위해 애써주시는 박해선 님이 우리말로 옮겼습니다. 중간중간 받아본 번역 원고에서 느껴지는 저자와 역자의 내공과 정성에 감명받았습니다. - 개앞맵시 (『밑바닥부터 시작하는 딥러닝』 역자)
|
파이썬으로 머신러닝을 시작하려는 사람을 위한 환상적인 안내서입니다. 제가 사이킷런을 시작했을 때 이 책이 없던 게 한스러울 따름입니다! - 해나 월릭 (마이크로소프트 리서치 선임 연구원)
|