|
1부. 파이썬 기초
1장. 파이썬 시작 1.1 파이썬이란? 1.2 왜 파이썬인가? 1.2.1 파이썬 대 R, 줄리아 및 기타 언어 1.3 파이썬이 아닌 이유 1.4 파이썬을 사용하는 경우 1.5 이 책의 사용 1.5.1 텍스트 정보 1.5.2 데이터 정보 1.5.3 온라인 자료 1.5.4 잘 안될 때 1.6 요점 2장. 파이썬 개요 2.1 시작하기 2.1.1 노트북 2.1.2 로컬에 파이썬 설치 2.1.3 로컬에서 파이썬 실행 2.2 파이썬 데이터 분석 기능 둘러보기 2.3 파이썬 명령 작업의 기초 2.3.1 파이썬 스타일 2.4 기본 유형 2.4.1 객체 및 유형 2.4.2 부울 2.4.3 숫자 유형 2.4.4 시퀀스 유형 2.4.5 텍스트 유형: 문자열 2.4.6 집합 유형 2.4.7 매핑 형식 2.4.8 함수, 클래스, 메서드 2.4.9 모듈과 패키지 2.4.10 제어 흐름 문 2.4.11 도움말! 쉬어가기 2.5 데이터 과학 패키지 2.5.1 NumPy 2.5.2 수학적 계산에 파이썬 사용 2.5.3 pandas 2.5.4 결측값 2.6 데이터 로드 및 저장 2.6.1 파이썬 객체 저장: 피클 2.6.2 데이터 가져오기 및 내보내기 2.6.3 코랩 사용: 데이터 가져오기 및 내보내기 2.7 정리! 2.8 더 알아보기* 2.9 요점 2부. 데이터 분석의 기초 3장. 데이터 설명 3.1 데이터 시뮬레이션 3.1.1 데이터 저장: 구조 설정 3.1.2 데이터 저장: 데이터 포인트 시뮬레이션 3.2 변수를 요약하는 함수 3.2.1 언어 요약: groupby() 3.2.2 이산 변수 3.2.3 연속 변수 3.3 데이터프레임 요약 3.3.1 describe() 3.3.2 데이터 검사에 대한 권장 접근법 3.3.3 apply() 3.4 단일 변수 시각화 3.4.1 히스토그램 3.4.2 상자 그림 3.4.3 정규성 확인을 위한 QQ 도면 3.4.4 누적 분포 3.4.5 지도 3.5 더 알아보기* 3.6 요점 4장. 연속 변수 간의 관계 4.1 소매 데이터 4.1.1 데이터 시뮬레이션 4.1.2 온라인 및 내점 판매 데이터 시뮬레이션 4.1.3 만족도 조사 응답 시뮬레이션 4.1.4 무응답 데이터 시뮬레이션 4.2 산점도가 있는 변수 간의 연관성 탐색 4.2.1 plot()을 사용해 기본 산점도 만들기 4.2.2 산점도의 포인트 색상 4.2.3 로그 스케일로 도식화 4.3 단일 그래픽 객체에서 도면 결합 4.4 산점도 행렬 4.4.1 scatter_matrix() 4.4.2 PairGrid() 4.5 상관 계수 4.5.1 상관관계 검정 4.5.2 상관 행렬 4.5.3 상관관계를 계산하기 전에 변수 변환 4.5.4 일반적인 마케팅 데이터 변환 4.5.5 박스-콕스 변환 4.6 설문 응답에서 연관성 탐색* 4.6.1 지터: 서수 도면을 더 유익하게 만들기 4.7 더 알아보기 4.8 요점 5장. 그룹 비교: 테이블 및 시각화 5.1 소비자 세그먼트 데이터 시뮬레이션 5.1.1 세그먼트 데이터 정의 5.1.2 최종 세그먼트 데이터 생성 5.2 그룹별 설명 찾기 5.2.1 양방향 그룹에 대한 설명 5.2.2 그룹별 시각화: 빈도와 비율 5.2.3 그룹별 시각화: 연속 데이터 5.2.4 통합하기 5.3 더 알아보기* 5.4 요점 6장. 그룹 비교: 통계 검정 6.1 그룹 비교를 위한 데이터 6.2 그룹 빈도 검정: scipystats.chisquare() 6.3 관찰된 비율 검정: binom_test() 6.3.1 신뢰 구간 정보 6.3.2 binom_test()와 이항 분포에 대한 추가 정보 6.4 그룹 평균 검정: t-검정 6.5 다중 그룹 평균 검정: 분산 분석(ANOVA) 6.5.1 수식 구문에 대한 간략한 소개 6.5.2 분산 분석 6.5.3 ANOVA에서 모델 비교 6.5.4 그룹 신뢰 구간 시각화 6.6 더 알아보기* 6.7 요점 7장. 결과의 동인 식별: 선형 모델 7.1 놀이공원 데이터 7.1.1 놀이공원 데이터 시뮬레이션 7.2 ols()로 선형 모델 적합화하기 7.2.1 예비 데이터 검사 7.2.2 요약: 이변량 연관성 7.2.3 단일 예측자가 있는 선형 모델 7.2.4 ols 객체 7.2.5 모델 적합 확인 7.3 다중 예측자가 있는 선형 모델 적합화 7.3.1 모델 비교 7.3.2 모델을 사용해 예측하기 7.3.3 예측자 표준화 7.4 요인을 예측자로 사용 7.5 상호 작용 항 7.5.1 언어 요약: 고급 수식 구문 7.5.2 주의! 과적합 7.5.3 선형 모델 적합화를 위한 권장 절차 7.6 더 알아보기* 7.7 요점 8장. 추가 선형 모델링 주제 8.1 고도로 상관된 변수 처리 8.1.1 온라인 지출의 초기 선형 모델 8.1.2 공선성 수정 8.2 이진 결과에 대한 선형 모델: 로지스틱 회귀 8.2.1 로지스틱 회귀 모델의 기초 8.2.2 시즌 패스의 로지스틱 회귀 데이터 8.2.3 판매 표 데이터 8.2.4 로지스틱 회귀 모델 적합화 8.2.5 모델 재고 8.2.6 추가 논의 8.3 계층적 모델 소개 8.3.1 일부 HLM 개념 8.3.2 놀이공원에 대한 등급 기반 공동 분석 8.3.3 평점 기반 결합 데이터 시뮬레이션 8.3.4 초기 선형 모델 8.3.5 mixedlm을 사용한 계층적 선형 모델 8.3.6 완전한 계층적 선형 모델 8.3.7 HLM 해석 8.3.8 HLM에 대한 결론 8.4 더 알아보기 8.5 요점 3부. 고급 데이터 분석 9장. 데이터 복잡도 줄이기 9.1 소비자 브랜드 평가 데이터 9.1.1 데이터 크기 조정 9.1.2 속성 간의 상관관계 9.1.3 브랜드별 종합 평균 등급 9.2 주성분 분석과 지각도 9.2.1 PCA 예 9.2.2 PCA 시각화 9.2.3 브랜드 평가를 위한 PCA 9.2.4 브랜드의 지각도 9.2.5 지각도에 대한 주의 9.3 탐색적 요인 분석 9.3.1 기본 EFA 개념 9.3.2 EFA 솔루션 찾기 9.3.3 EFA 로테이션 9.3.4 브랜드에 요인 점수 사용 9.4 다차원 척도법 9.4.1 비계량 MDS 9.4.2 저차원 임베딩을 사용한 시각화 9.5 더 알아보기 9.6 요점 10장. 세그멘테이션: 부분 모집단 탐색을 위한 비지도 클러스터링 방법 10.1 세그멘테이션 철학 10.1.1 세그멘테이션의 어려움 10.1.2 클러스터링으로서의 세그멘테이션과 분류 10.2 세그멘테이션 데이터 10.3 클러스터링 10.3.1 클러스터링 단계 10.3.2 계층적 클러스터링 10.3.3 계층적 클러스터링 계속: fcluster의 그룹 10.3.4 평균 기반 클러스터링: k_means() 10.3.5 모델 기반 클러스터링: GaussianMixture() 10.3.6 클러스터링 요약 10.4 더 알아보기 10.5 요점 11장. 분류: 알려진 범주에 관측치 할당 11.1 분류 11.1.1 나이브 베이즈 분류: GaussianNB() 11.1.2 랜덤 포레스트 분류: RandomForestClassifier() 11.1.3 랜덤 포레스트 변수 중요도 11.2 예측: 잠재 고객 식별 11.3 더 알아보기 11.4 요점 12장. 결론 |
저제이슨 슈바르츠
Jason Schwarz
저크리스 채프먼
Chris Chapman
저에리 맥도넬 파이트
Elea McDonnell Feit
역(주)크라스랩
* 이 책의 대상 독자 *
파이썬을 배우고 싶어 하는 마케팅 연구원 분석가나 파이썬을 사용해 선택한 마케팅 주제를 검토하려는 다른 분야의 학생이나 연구원이 읽기에 적합한 책이다. * 이 책의 구성 * 순차적으로 7개 장에 걸쳐 개념을 점진적으로 가르치고, 작업하면서 예제를 직접 실습해본다. 1부에서 파이썬 언어의 기초에 대해 약간의 시간을 보낸 다음, 2부에서는 실제 마케팅 분석 문제에 적용한다. 3부에서는 몇 가지 고급 마케팅 주제를 살펴본다. 전체 장에서 파이썬의 위력을 보여주고 있다. * 지은이의 말 * 이 책은 독자 여러분이 마케팅 조사와 분석을 위해 파이썬을 배울 수 있게 도와준다. 파이썬은 마케팅 분석가에게는 훌륭한 선택이며, 통계 모델을 적합화하기 위한 고급 기능을 제공한다. 파이썬은 확장 가능하며 소규모와 대규모 데이터셋 모두에서 다양한 형태로 여러 시스템 데이터를 처리할 수 있다. 파이썬 생태계에는 시각화 기술뿐만 아니라 광범위한 기존의 통계 기법과 새로운 통계 기법이 포함된다. 그러나 마케팅 영역에서의 사용은 계량 경제학, 생물 정보학, 전산학 등의 분야보다 뒤처져 있다. 독자들의 도움으로 이 상황이 바뀔 수 있길 바란다. 이 책을 읽기 위한 전제 조건은 파이썬을 이용한 마케팅에 관심이 있고 선형 회귀와 같은 기본 통계 모델에 개념적으로 익숙하며 직접 실습에 참여할 의향이 있으면 충분하다. 이 책은 어느 정도의 프로그래밍 경험이 있으면서 파이썬을 배우고자 하는 분석가들에게 특히 도움이 될 것이다. * 옮긴이의 말 * 파이썬을 사용해 마케팅 분석을 수행하는 각종 방법론을 설명한 책이다. 통계적인 유의성에 기반해 다양한 마케팅 사례를 설명하는데, 마케팅 사례 분석을 위해 파이썬의 문법과 함께 통계적 분석 또한 동시에 배울 수 있으므로 일석삼조의 효과를 볼 수 있다. 특히 다양한 그래픽 기법을 통해 데이터 분석에 있어 가장 중요한 시각화 기법을 익힐 수 있다. 다양한 통계 수학이 동원되지만, 복잡한 수식을 전개하는 것은 최대한 자제했으며 대부분의 개념을 어려운 수학을 이해하지 않고도 습득할 수 있도록 배려한 부분 또한 돋보인다. 마케팅에 종사하고 있는 사람이거나, 혹은 마케팅 분야가 아니더라도 기초 데이터의 통계적 분석 기법을 파이썬을 통해 배우고자 한다면 이 책은 좋은 선택이 될 것이다. 파이썬을 전혀 모르는 사람들을 위해 한 장에 걸쳐 파이썬의 주요 기본 문법과 데이터 유형을 일목요연하게 정리했다. 따라서 데이터 분석에 관심이 있는 사람은 물론 처음으로 파이썬을 배우고자 하는 사람들에게도 좋은 지침서가 될 수 있을 것이다. |