『데이터 과학자와 데이터 엔지니어를 위한 인터뷰 문답집』은 간단한 내용부터 복잡한 내용까지, 로지스틱 회귀, 랜덤 포레스트 등 전통적인 머신러닝에서 GANs, 강화학습 등 최신 알고리즘까지 차례대로 전개되며, 머신러닝 각각의 영역을 포괄하는 간결한 문답 형식으로 되어 있다. 따라서 인공지능 분야에 종사하기 위해 알아야 할 기술을 잘 설명하고 있는 동시에 독자들의 필요에 따라, 역량에 따라 주제와 난이도별로 골라 읽는 학습을 통해 필수 기술을 익힐 수 있도록 도와준다.
CHAPTER 1 피처 엔지니어링 1① 피처 정규화 3② 범주형 피처 6③ 고차원 결합 피처의 처리 방법 9④ 결합 피처 12⑤ 텍스트 표현 모델 14⑥ Word2Vec 17⑦ 이미지 데이터가 부족할 때는 어떻게 처리해야 할까요? 20CHAPTER 2 모델 평가 23① 평가 지표의 한계 25② ROC 곡선 31③ 코사인 거리의 응용 38④ A/B 테스트의 함정 43⑤ 모델 평가 방법 46⑥ 하이퍼파라미터 튜닝 49⑦ 과적합과 과소적합 52CHAPTER 3 클래식 알고리즘 55① 서포트 벡터 머신 57② 로지스틱 회귀 67③ 의사결정 트리 71CHAPTER 4 차원축소 85① PCA 최대분산 이론 87② PCA 최소제곱오차 이론 92③ 선형판별분석 96④ 선형판별분석과 주성분분석 101CHAPTER 5 비지도학습 107① k평균 클러스터링 109② 가우스 혼합 모델 121③ 자기 조직화 지도 125④ 클러스터링 알고리즘 평가 131CHAPTER 6 확률 그래프 모델 137① 확률 그래프 모델의 결합확률분포 139② 확률 그래프 표현 142③ 생성모델과 판별모델 146④ 마르코프 모델 148⑤ 토픽 모델 156CHAPTER 7 최적화 알고리즘 163① 지도학습에서의 손실함수 165② 머신러닝에서의 최적화 문제 169③ 전통적인 최적화 알고리즘 172④ 경사하강법 검증 방법 177⑤ 확률적 경사하강법 180⑥ 확률적 경사하강법의 가속 184⑦ L1 정규화와 희소성 192CHAPTER 8 샘플링 199① 샘플링의 역할 201② 균등분포의 난수 204③ 자주 사용하는 샘플링 방법 207④ 가우스 분포 샘플링 212⑤ 마르코프 체인 몬테카를로 219⑥ 베이지안 네트워크 샘플링 225⑦ 불균형 샘플 집합에서의 리샘플링 230CHAPTER 9 피드 포워드 신경망 235① 다층 퍼셉트론과 부울 함수 237② 딥러닝의 활성화 함수 245③ 다층 퍼셉트론의 오차역전파 알고리즘 249④ 딥러닝 훈련 테크닉 257⑤ 합성곱 신경망 263⑥ ResNet 271CHAPTER 10 순환신경망 277① 순환신경망과 합성곱 신경망 279② 순환신경망의 그래디언트 소실 문제 281③ 순환신경망의 활성화 함수 284④ LSTM 네트워크 286⑤ Seq2Seq 모델 290⑥ 어텐션 메커니즘 294CHAPTER 11 강화학습 299① 강화학습 기초 301② 비디오 게임에서의 강화학습 308③ 폴리시 그래디언트 313④ 탐색과 이용 317CHAPTER 12 앙상블 학습 323① 앙상블 학습의 종류 325② 앙상블 학습 단계와 예제 329③ 기초 분류기 332④ 편향과 분산 334⑤ GBDT 알고리즘의 기본 원리 338⑥ XGBoost와 GBDT의 차이점, 그리고 연관성 342CHAPTER 13 생성적 적대 신경망 347① 처음 만나는 GANs의 비밀 349② WGAN: 저차원의 유령을 잡아라 357③ DCGAN: GANs이 합성곱을 만났을 때 365④ ALI 372⑤ IRGAN: 이산 샘플의 생성 377⑥ SeqGAN: 텍스트 시퀀스 생성 382CHAPTER 14 인공지능의 응용 현황 391① 알고리즘 마케팅 393② 게임에서의 인공지능 409③ 자율 주행에서의 AI 428④ 기계 번역 439⑤ 인간과 컴퓨터 상호작용 443에필로그 및 저자 소개 449참고문헌 465찾아보기 470
로지스틱 회귀, 랜덤 포레스트 등 전통적인 머신러닝에서 GANs, 강화학습 등 최신 알고리즘까지!분야별, 난이도별로 잘 구성된 실전 면접 문제!이 책은 간단한 내용부터 복잡한 내용까지, 로지스틱 회귀, 랜덤 포레스트 등 전통적인 머신러닝에서 GANs, 강화학습 등 최신 알고리즘까지 차례대로 전개되며, 머신러닝 각각의 영역을 포괄하는 간결한 문답 형식으로 되어 있습니다. 따라서 인공지능 분야에 종사하기 위해 알아야 할 기술을 잘 설명하고 있는 동시에 독자들의 필요에 따라, 역량에 따라 주제와 난이도별로 골라 읽는 학습을 통해 필수 기술을 익힐 수 있도록 도와줍니다.Hulu 데이터 과학팀 실전 면접 문제 수록!Hulu(훌루)는 넷플릭스 대항마로 월트 디즈니가 설립한 OTT(Over The Top) 서비스 회사이며, 이 책은 스탠퍼드대학교, 칭화대학교, 베이징대학교 등 일류 대학 출신들로 구성된 Hulu 데이터 과학팀 멤버 15인이 튼튼한 수학 기초, 알고리즘 시스템에 대한 완전한 이해, 모델에 대한 깊은 이해를 제공하기 위해 집필한 서적입니다. 데이터 과학자/데이터 엔지니어가 알아야 할 필수 스킬 트리 PDF 파일 제공!데이터 과학자/데이터 엔지니어를 위한 스킬 트리(기술 로드맵) PDF 파일이 온라인으로 무료 제공됩니다.