이미 소장하고 있다면 판매해 보세요.
1장. 집단지성 소개
1.1 집단지성이란? 1.2 기계학습이란? 1.3 기계학습의 한계 1.4 실제 예 1.5 기계학습의 다른 사례 2장. 추천시스템 만들기 2.1 협업 필터링 2.2 선호 정보 수집 2.3 유사 사용자 찾기 2.4 항목 추천 2.5 제품 매칭 2.6 딜리셔스 링크 추천 기능 만들기 2.7 항목 기반 필터링 2.8 무비렌즈(MovieLens) 데이터 세트 이용하기 2.9 사용자 기반과 항목 기반 필터링 2.10 함께 풀어보기 3장. 군집 발견 3.1 감독 대 무감독 학습 3.2 단어 벡터 3.3 계층적 군집화 3.4 계통도 출력 3.5 세로줄 군집화 3.6 k평균 군집화 3.7 선호도 군집 3.8 2차원으로 데이터 보기 3.9 군집 가능한 다른 것들 3.10 함께 풀어보기 4장. 검색과 랭킹 4.1 검색엔진이란? 4.2 단순 크롤러 4.3 색인하기 4.4 검색하기 4.5 내용 기반 랭킹 4.6 유입 링크 사용하기 4.7 클릭 학습 4.8 함께 풀어보기 5장. 최적화 5.1 단체 여행 5.2 해답 표현하기 5.3 비용 함수 5.4 무작위 검색 5.5 언덕등반 5.6 시뮬레이티드 어닐링 5.7 유전자 알고리즘 5.8 비행편 검색 실제 5.9 선호도 최적화 5.10 네트워크 시각화 5.11 다른 가능성들 5.12 함께 풀어보기 6장. 문서 필터링 6.1 스팸 필터링 6.2 문서와 단어 6.3 분류기 훈련시키기 6.4 확률 계산 6.5 기본 분류기 6.6 피셔 방식 6.7 학습 정보 저장 6.8 블로그 피드 필터링 6.9 향상된 특성 검출법 6.10 Akismet 사용하기 6.11 다른 기법들 6.12 함께 풀어보기 7장. 의사결정트리 7.1 가입 유형 추정 7.2 의사결정트리 소개 7.3 트리 학습 7.4 최적 단편 선정 7.5 재귀적으로 트리 만들기 7.6 트리 출력하기 7.7 새로운 관찰 분류하기 7.8 트리 가지치기 7.9 손상된 데이터 다루기 7.10 숫자 결과 다루기 7.11 주택 가격 모델링 7.12 "인기도" 모델링 7.13 의사결정트리 활용 시점 7.14 함께 풀어보기 8장. 가격 모델링 8.1 예제 데이터 세트 만들기 8.2 kNN 8.3 물품 가중치 8.4 교차검증 8.5 이질 변수 8.6 축척 최적화 8.7 불균등 분포 8.8 실 데이터 - 이베이 API 8.9 적절한 kNN 활용 방법 8.10 함께 풀어보기 9장. 고급 분류 기법: 커널 기법과 SVM 9.1 중매 데이터 세트 9.2 데이터를 다루는 어려움 9.3 기본 선형 분류 9.4 분류 데이터의 특성 9.5 데이터 축척 조정 9.6 커널 기법 이해 9.7 지지벡터머신 9.8 LIBSVM 사용 9.9 페이스북 매칭 9.10 함께 풀어보기 10장. 독립 특성 발견 10.1 뉴스 코퍼스 10.2 이전 방식들 10.3 비음수 행렬 인수분해 10.4 결과 출력하기 10.5 주식시장 데이터 사용하기 10.6 함께 풀어보기 11장. 진화지성 11.1 유전자 프로그래밍이란? 11.2 프로그램을 트리로 표현하기 11.3 초기 개체군 만들기 11.4 해답 검증하기 11.5 프로그램 돌연변이 시키기 11.6 교배하기 11.7 환경 구축하기 11.8 간단한 게임 11.9 다른 가능성들 11.10 함께 풀어보기 12장. 알고리즘 요약 12.1 베이지안 분류기 12.3 신경망 12.4 지지벡터머신 12.5 KNN 12.6 군집화 12.7 다차원 비례 축소법 12.8 비음수 행렬 인수분해 12.9 최적화 부록 A. 외부 라이브러리 부록 B. 수학 공식 |
장별 내용
1장. 집단지성 소개 이 장에서는 기계학습 뒤에 숨겨진 개념을 설명하고, 이를 다른 영역에 적용하는 방법과 다수 사람들로부터 모은 데이터에서 새로운 결론을 꺼내는 방법을 설명한다. 2장. 추천 이 장에서는 온라인 소매상점에서 제품이나 미디어를 추천하는 데 곧잘 사용되는 협업 필터링 기법을 소개한다. 또한 소셜 북마크 사이트에서 링크를 사람들에게 추천하고 무비렌즈(MovieLens) 데이터 세트에서 영화를 추천하는 시스템을 만드는 방법에 대해서도 소개한다. 3장. 군집 발견 이 장에서는 2장의 아이디어를 이용해서 대규모 데이터 세트에서 유사항목을 가진 그룹을 자동으로 검출하는 두 개의 군집 기법들을 소개한다. 즉, 인기 블로그 집합에서 그리고 소셜 네트워킹 웹 사이트로부터의 사람들의 요구에서 그룹을 찾기 위해 군집을 사용하는 방법을 보여준다. 4장. 검색과 랭킹 이 장에서는 크롤러, 인덱서, 쿼리엔진과 같은 검색엔진 구조를 설명한다. 또한 유입 링크를 활용하여 웹 페이지 점수를 매기는 페이지랭킹(PageRanking) 알고리즘도 다루며, 검색어와 연계된 검색 결과를 학습하는 신경망(Neural Network)을 만드는 방법도 소개한다. 5장. 최적화 기법 이 장에서는 한 문제에 대한 수백만의 가능한 해답 중 최적 해답을 찾도록 설계된 최적화 알고리즘을 소개한다. 이 알고리즘의 다양한 사용법이 같은 지역을 여행하는 단체 여행객이 최적의 비행편을 찾는 문제와 학생들을 기숙사에 배치하는 가장 좋은 방법 그리고 최소의 교차점을 가지는 네트워크 배치 문제를 통해 소개된다. 6장. 문서 필터링 이 장에서는 베이지안 필터링 기법을 소개한다. 이 기법은 여러 무료 또는 상용 스팸 필터에서 사용하는 기법으로 단어의 유형 또는 문서 내의 여러 특성을 기반으로 문서를 자동 분류한다. 여기서는 이것을 RSS 검색 결과 집합에 적용하여 자동적으로 RSS 항목들을 분류하는 예제를 다룬다. 7장. 의사결정트리 모델링 의사결정트리(decision tree)는 예측뿐만 아니라 의사결정 과정 모델링에 유용한 방법이다. 첫 번째 의사결정트리는 서버로그에서 추출한 가상데이터로 만들고, 사용자가 프리미엄 가입자가 될 것인지 아닌지를 판단하는 데 사용한다. 기타 예제에서는 부동산 가격과 인기도를 모델링하는 데 부동산 웹 사이트의 데이터를 이용한다. 8장. 가격 모델링 이 장에서는 5장의 최적화 기법과 kNN 기법을 분류가 아닌 숫자 값 예측 문제에 적용해 본다. 이 방법들을 이베이 오픈 API와 결합하여 속성 집합에 기반을 둔 경매 물건들의 최종 경매 가격을 예측하는 시스템을 구축한다. 9장. 고급 분류 기법들: 커널 기법과 SVM 이 장에서는 온라인 데이트 사이트에서 사람들을 중매하거나 전문가 연락처를 검색하는 데 SVM(support-vector machine) 기법을 적용해 본다. SVM은 상당히 고급 기법으로, 다른 기법들과 비교도 해 본다. 10장. 독립 특성 발견 이 장에서는 다소 새로운 기법인 NMF(non-negative matrix factorization) 기법을 소개한다. 이 기법은 데이터 세트에서 독립적인 특성들을 찾는 데 사용된다. 많은 데이터 세트 내의 항목들은 미리 알기 어려운 다른 특성들과의 조합으로 생성되는데, 여기서는 이 특성들을 발견하는 것이다. 뉴스 기사 세트에 적용해서 주제를 검출하고 해당 주제를 가지는 뉴스 기사를 찾는 예제에 이 기법을 적용해 본다. 11장. 진화지성 이 장에서는 유전자 프로그래밍(genetic programming)을 소개한다. 이 기법은 최적화 기법을 넘는 고상한 기법으로 진화 사상을 이용해서 알고리즘을 생성하여 특정 문제를 해결하는 데 이용된다. 또한 컴퓨터가 처음에는 초보 플레이어지만 게임이 진행될수록 자신의 코드를 개선해 가며 기술을 향상시키는 간단한 게임 예제를 다룬다. 12장. 알고리즘 요약 이 장에서는 이 책에서 소개한 기계학습과 통계 알고리즘을 검토하고 이들을 인공지능 문제들에 비교한다. 이는 독자스스로 알고리즘 동작원리와 알고리즘이 데이터를 분할하는 방법을 이해하는 데 도움을 줄 것이다. |
세련된 웹 2.0 서비스 구축을 위한 집단지성 프로그래밍!
이 책은 참여 중심의 인터넷 서비스에서 생성한 방대한 데이터를 이용하는 웹 2.0 서비스 구축 방법을 알려준다. 기계학습과 통계의 세계로 독자를 인도하여 매일 수집되는 사용자 데이터로부터 사용성, 마케팅, 개인성향, 행태분석에 대한 결론을 끌어내는 방법을 보여준다. 또한 웹 사이트, 블로그, 위키, 기타 특수 애플리케이션에서 바로 사용할 수 있는 깔끔하게 정리한 알고리즘을 코드와 함께 제공한다. 이 책의 주요 내용 * 온라인 소매상이 제품 또는 미디어를 추천할 때 사용하는 협업 필터링 기법 * 대용량 데이터에 내재된 유사 아이템 묶음을 검출할 때 사용하는 군집 기법 * 특정 문제에 대한 수백만 개의 해결책 중 최선책을 찾을 때 사용하는 최적화 알고리즘 * 단어유형 및 기타 특성을 이용한 문서분류 기술인 베이지안 필터링 기법 * 온라인 데이트 사이트에서 짝짓기에 사용되는 SVM 기술 * 문제 해결에 사용되는 유전자 프로그래밍 - 이 책을 읽기 위해 데이터 분석, 기계학습, 통계 등에 대한 사전지식은 필요 없다. 최대한 수학적인 개념들을 간단히 설명하려고 했지만 삼각법과 기본통계를 알면 알고리즘 이해에 도움이 될 것이다. - 각 절 내 코드 예제를 가이드북 형태로 만들어 독자스스로 응용 프로그램을 단계별로 만들고 알고리즘 동작원리의 이해를 돕는다. - 이 책에 나오는 예제 코드는 파이썬(python)으로 작성되으나 다른 언어 프로그래머도 이해할 수 있게 모든 알고리즘에 설명을 붙였다. |