이미 소장하고 있다면 판매해 보세요.
CHAPTER 1 데이터 마이닝 개요
1. 데이터 마이닝의 의미 2. 데이터 마이닝과 비즈니스 인텔리전스 3. 데이터 마이닝의 활용 분야 4. 데이터 마이닝의 필요성 5. 데이터 마이닝 시스템의 구조 6. 데이터 마이닝 관련 용어 정리 7. 데이터 마이닝 기원 8. 데이터 마이닝: 다양한 학문의 합류점 9. OLAM 구조 10. 데이터 마이닝의 급속한 성장 11. 데이터 마이닝의 응용 분야 12. 왜 다양한 데이터 마이닝 기법들이 존재하는가? 13. 용어와 표기 · 연습문제 CHAPTER 2 데이터 기초 분석 1. 변수의 종류 1.1 수치형 변수와 범주형 변수 1.2 시계열 자료와 횡단면 자료 2. 자료의 측정 2.1 명목척도 2.2 서열척도 2.3 구간척도 2.4 비율척도 3. 자료의 정리 3.1 도수분포표 3.2 히스토그램 4. 산포도 4.1 산포도-시계열 그래프 5. 피벗테이블 · 연습문제 CHAPTER 3 데이터 마이닝 프로세스 1. 데이터 마이닝 기법 2. 지도학습과 자율학습 3. 데이터 마이닝 단계 4. 데이터 마이닝 사전 단계 5. 모형 구축: 선형 회귀분석을 이용한 예제 · 연습문제 CHAPTER 4 차원 축소 1. 차원 축소 2. 예제를 통한 고찰 3. 데이터의 요약 4. 상관관계 분석 5. 데이터 수의 축소-표본추출 6. 변수 수의 축소-주성분분석 · 연습문제 CHAPTER 5 분류 및 예측 성능의 평가 1. 개요 2. 분류모형 평가 2.1 분류모형 평가를 위한 측도 3. 예측모형의 성과평가 · 연습문제 CHAPTER 6 회귀 분석 1. 개요 2. 선형회귀분석 3. 선형회귀분석의 예측변수 선정 4. 로지스틱 회귀분석 5. 다중선형회귀분석 6. 분류 성과의 평가 7. 적합도 평가 · 연습문제 CHAPTER 7 k 최근접이웃기법 1. k 최근접이웃기법 2. K의 선택 3. k-최근접 기법 예측기 4. k 최근접이웃기법의 특성 · 연습문제 CHAPTER 8 나이브 베이즈 분류 모형 1. 개요 2. 베이즈 정리 3. 베이즈 정리를 사용한 분류 4. 단순 규칙 5. 나이브 베이즈 분류 모형 6. 나이브 베이지안 분류모형의 특성과 장단점 7. 나이브 베이지안 분류기의 예 · 연습문제 CHAPTER 9 분류와 회귀나무 1. 결정나무 2. 분류 과정(모델 구조) 3. 분류 과정 2(예측을 위한 모델의 사용) 4. 의사결정 트리 구축하기 5. 결정나무 알고리즘의 비교 6. 과적합 없애기 7. 악취 데이터 예제 8. 분류나무에 의한 분류 규칙 9. 모형의 장단점과 추가 고려사항 · 연습문제 CHAPTER 10 군집분석 1. 군집분석 2. 단순한 군집의 예 3. 군집분석 모형 4. 계층적 군집분석 4.1 두 레코드 간 거리 계산 4.2 두 군집 간 거리 계산 5. K-평균 알고리즘 5.1 k-means 군집화 장단점 6. EM 알고리즘 7. 악취데이터 예제 · 연습문제 CHAPTER 11 인공 신경망 1. Elementary Neurophysiology: Neuron 2. Hebbian Learning 3. 단층신경망 4. 다층신경망 5. 다층신경망 모형의 학습 6. 과적합 없애기 7. 신경망 모형의 장단점 · 연습문제 CHAPTER 12 연관성 규칙 1. 시장바구니 분석 개요 1.1 시장바구니 분석(연관성 규칙 발견)이란? 1.2 거래와 항목 1.3 연관성 규칙 2. 시장바구니 분석의 기본 개념 2.1 거래데이터 2.2 연관성 규칙 발견 3. 시장바구니 분석 지표 3.1 지지도와 신뢰도 1 3.2 지지도와 신뢰도 2 4. 연관성 규칙 기법의 기본 과정 4.1 1단계: 적절한 제품 수준에 따른 분석 항목 선정 4.2 2단계: 동시구매 행렬(co-occurrence matrix) 작성 및 확률 계산 4.3 3단계: 확률 분석과 유용한 연관성 규칙 결정 5. 시장바구니 분석 예제 6. 연관성 규칙의 장 단점 7. 어프라이어리 알고리즘(Apriori Algorithm) 8. 기타 연관성 규칙 기법 8.1 순차적 연관성 규칙 발견(Sequence Association Rules Discovery) 8.2 다수준 연관성 규칙(Multi-level Association Rules) 8.3 다수준 내 균일 지지도 사용 연관성 규칙 8.4 다수준 내 감소 지지도 사용 연관성 규칙 · 연습문제 CHAPTER 13 부록: 소프트웨어 소개 및 설치 1. WEKA 소프트웨어 설치 및 사용 1.1 R 소프트웨어 1.2 R-Studio 소프트웨어 2. COLAB 소프트웨어 찾아보기 |
최상현의 다른 상품
데이터 마이닝은 원래의 자료(raw fact) 그 자체만으로는 제공되지 않는 정보를 추출하기 위해 자료를 분석하는 과정, 사용된 알고리즘, 이를 지원하는 일련의 도구들을 말한다. 자료가 모여 데이터가 되고 데이터에 포함된 의미들을 찾아낸 후 이를 정보로 활용하게 된다. 정보를 찾기 위한 방법으로 통계학이 많이 활용되었으며, 20세기 후반에는 핵심적인 학문 분야로 진화해 왔다. 1990년대 이후에는 엄청난 양의 데이터 소스가 폭발적으로 증가하면서 빅데이터 분석의 중요성이 더욱 커졌다. 빅데이터 분석에서는 다양한 데이터 형태의 데이터를 어떻게 통합적으로 관리하고 분석하는 것이 효과적이고 효율적인지에 관해 관심이 크게 증가하고 있다.
대부분의 기업은 업무 효율성 향상을 위해 정보시스템을 활용하고 있다. 정보시스템에 축적된 다양한 형태의 비즈니스 데이터가 폭발적으로 증가하면서 비즈니스 분야의 빅데이터 분석 응용이 전략적으로 중요해지고 있다. 이와 같은 빅데이터 분석을 위한 알고리즘 등의 데이터 마이닝 활용은 기업들의 필수적이며 전략적인 무기가 되고 있다. 이 책에서는 데이터 마이닝의 시작이라고 할 수 있는 기초 분석에서부터 데이터 전처리 방법, 다양한 알고리즘 및 이를 사용한 다양한 활용 사례에 대해 설명한다. 또한 이 책에서는 경영정보학 전공 학생뿐만 아니라 일반 경영학 전공 학생들과 기업/기관의 일반 분석 실무자들에게 어떻게 데이터 마이닝 기법이 빅데이터 분석을 위해 사용될 수 있는지 제반 지식을 전달하고자 한다. 빅데이터 분석을 수행하기 위해 필요한 기본적인 알고리즘에 대한 소개, 범용적인 데이터 마이닝 도구인 웨카 사용 방법을 주로 다룬다. 이 외에도 데이터 사이언티스트들도 활용할 수 있도록 R 프로그래밍과 파이썬 코드도 같이 소개한다. 필자는 20여 년간 빅데이터 분석에 사용될 수 있는 하나하나의 알고리즘을 사용하려는 방법을 학습하기 위한 교재를 만드는 과정에서 여러 가지 강의 자료를 정리하여 사례와 함께 실습할 수 있도록 노력하였다. |