이미지 검색을 사용해 보세요
검색창 이전화면 이전화면
최근 검색어
인기 검색어

소득공제
SPSS, R, Python을 활용한 Kaggle 데이터 전략 실무 연습
베스트
경상계열 top100 4주
가격
28,000
28,000
YES포인트?
0원
5만원 이상 구매 시 2천원 추가 적립
결제혜택
카드/간편결제 혜택을 확인하세요
  • 도서 내부에 R/Python 코드를 확인할 수 있는 QR코드가 있습니다.

이미 소장하고 있다면 판매해 보세요.

  •  국내배송만 가능
  •  최저가 보상
  •  문화비소득공제 신청가능

책소개

목차

Chapter 01. 데이터 과학과 Kaggle 활용
1.1 데이터 과학과 왜 Kaggle인가?
1.2 빅데이터 전문가들의 플랫폼, Kaggle 탐색
1.2.1 Competition
1.2.2 Code
1.2.3 Discussion
1.2.4 Datasets
1.2.5 Courses

Chapter 02. Kaggle(telco churn data) 활용 실습 사례
2.1 데이터 분석 프로세스
2.2 Kaggle 데이터를 중심으로 상황 가정과 외?내부 환경 분석
2.3 데이터 탐색을 위한 기초통계 및 시각화
2.4 통신사 고객 이탈 인과관계 파악
2.5 통신사 고객 이탈 예측
2.6 데이터 분석을 통한 전략 도출
2.7 데이터 분석 실습 구성

Chapter 03. Kaggle 데이터를 활용한 이진 분류 예측
3.1 통신사 고객 이탈 예측
3.1.1 데이터 분석 개요
3.1.2 데이터 탐색
3.1.3 연관성 분석
3.1.4 통신사 고객 이탈 데이터 인과관계분석
3.1.5 예측 모델 설계
3.1.6 데이터 저장하기
3.2 퇴직 가능성 예측
3.2.1 데이터 분석 개요
3.2.2 데이터 전처리
3.2.3 데이터 탐색
3.2.4 종속변수와의 연관성 분석
3.2.5 예측 모델 구축
3.3 개인 신용 위험 예측
3.3.1 데이터 분석 개요
3.3.2 데이터 파악 및 전처리
3.3.3 데이터 탐색
3.3.4 종속변수와의 관계 분석
3.3.5 예측 모델
3.4 마케팅 캠페인 반응 데이터 분석
3.4.1 데이터 분석 개요
3.4.2 데이터 전처리
3.4.3 데이터 탐색
3.4.4 반응 예측 모델
3.4.5 분석 결과 활용 전략 수립

Chapter 04. Kaggle 데이터를 활용한 연속변수 예측
4.1 고객생애가치 데이터 분석
4.1.1 데이터 분석 개요
4.1.2 데이터 전처리
4.1.3 데이터 탐색
4.1.4 고객생애가치 예측 모델
4.1.5 분석 결과 활용
4.2 부동산 가격 예측
4.2.1 데이터 분석 개요
4.2.2 데이터 전처리
4.2.3 데이터 탐색
4.2.4 부동산 가격과의 관계 분석
4.2.5 가격예측 모델 구축

Chapter 05. Kaggle 데이터를 활용한 현황 분석
5.1 서울시 유동인구 데이터 기반 상권 분석
5.1.1 데이터 분석 개요
5.1.2 데이터 전처리
5.1.3 데이터 탐색 및 시각화
5.1.4 서울시 유동인구 분석을 위한 모델링
5.2 서울시 지하철 탑승객 데이터 기반 상권 분석
5.2.1 데이터 분석 개요
5.2.2 데이터 전처리
5.2.3 데이터 탐색 및 시각화
5.2.4 지하철 탑승객 분석을 위한 군집화 모델링
5.3 서울시 대기질 분석
5.3.1 데이터 분석 개요
5.3.2 데이터 전처리
5.3.3 데이터 탐색 및 시각화
5.3.4 미세먼지 예측을 위한 모델링

Chapter 06. Kaggle 데이터를 활용한 이상탐지
6.1 의료보험 이상탐지
6.1.1 데이터 분석 개요
6.1.2 데이터 전처리
6.1.3 데이터 탐색
6.1.4 특이 케이스 식별
6.1.5 이상치 결과 평가
6.1.6 분석 결과 활용
6.2 신용카드 부정거래 탐지
6.2.1 데이터 분석 개요
6.2.2 부정 사용 탐지를 위한 파생변수 생성
6.2.3 데이터 탐색
6.2.4 종속변수와의 관계 분석
6.2.5 카드 부정 사용 예측 모델

저자 소개5

[학력] 조지아주립대학 경영학박사 MIS 전공(1995) [경력] 메타버스 감성혁신포럼 의장(2021~현재) 숭실대학교 경영학부 교수, SNS마케팅 연구소장(1996~현재) 한국 IT서비스학회 회장, 한국 글로벌경영학회 회장(2014~2016, 2020) [수상] 옥조근정훈장(2021) Marquis Who’s Who in the World, Albert Nelson Lifetime Achiever(Data Analysis 분야)(2017) Top 100 Educators in the World(세계 100대 교육자) 영국 국제인명센터 IBC 등재(2015) [
[학력]
조지아주립대학 경영학박사 MIS 전공(1995)
[경력]
메타버스 감성혁신포럼 의장(2021~현재)
숭실대학교 경영학부 교수, SNS마케팅 연구소장(1996~현재)
한국 IT서비스학회 회장, 한국 글로벌경영학회 회장(2014~2016, 2020)
[수상]
옥조근정훈장(2021)
Marquis Who’s Who in the World, Albert Nelson Lifetime Achiever(Data Analysis 분야)(2017)
Top 100 Educators in the World(세계 100대 교육자) 영국 국제인명센터 IBC 등재(2015)
[연구실적]
빅데이터분석분야 국내외 저널 약 150여 편 논문발간

김광용의 다른 상품

[학력] 숭실대학교 일반대학원 IT정책경영학과 공학박사(2019.8) 중앙대학교 일반대학원 통계학과 경제학석사(1990.2) [경력] ㈜데이타솔루션 빅데이터 러닝센터 총괄상무(1990.7~현재) [연구실적] 대학도서관 시범평가 정량지표 점수 산출 방식 및 만족도 조사 추진 방법에 대한 통계적 검토(2020) 데이터 활용역량 진단 및 평가 ?개인 자가진단 모델을 중심으로(2020) 벡터공간모델을 활용한 상품추천 알고리즘에 관한 실증연구(2019) 데이터과학자의 이직의도에 미치는 요인에 관한 연구(2019) Measuring Similarity of Travel B
[학력]
숭실대학교 일반대학원 IT정책경영학과 공학박사(2019.8)
중앙대학교 일반대학원 통계학과 경제학석사(1990.2)
[경력]
㈜데이타솔루션 빅데이터 러닝센터 총괄상무(1990.7~현재)
[연구실적]
대학도서관 시범평가 정량지표 점수 산출 방식 및 만족도 조사 추진 방법에 대한 통계적 검토(2020)
데이터 활용역량 진단 및 평가 ?개인 자가진단 모델을 중심으로(2020)
벡터공간모델을 활용한 상품추천 알고리즘에 관한 실증연구(2019)
데이터과학자의 이직의도에 미치는 요인에 관한 연구(2019)
Measuring Similarity of Travel Blog Documents(2019)
[학력] 숭실대학교 공학박사 IT서비스경영 전공(2018) [경력] 용인대학교 AI학부 교수(2020~현재) / 교수학습지원센터장(2022~현재) (사)한국융합보안학회 이사(2020~현재) (사)글로벌경영학회 이사(2019~2020) 기업·기술가치평가사(2018~현재)
[학력] 숭실대학교 경영학박사 MIS 전공(2018) [경력] 와이더플래닛 팀장(2021~2022) 롯데멤버스 매니저(2020~2021) 지티씨솔루션 책임(2018~2019) 티몬 매니저(2016~2017)
[학력] 숭실대학교 일반대학원 경영학과 MIS 전공 석사(2019.2) [경력] SNS마케팅연구소 연구원(2019.2~현재) [연구실적] The Detection of Brand Identity and Image Using Semantic Network Analysis(2022) (기상청) 기상융합서비스 정책 및 운영체제 개선을 위한 비즈니스모델 조사·분석(2021) The Effects of Product’s Visual Preview and Customer Review on Sale Performance in Mobile Commerce (2021) The Ef
[학력]
숭실대학교 일반대학원 경영학과 MIS 전공 석사(2019.2)
[경력]
SNS마케팅연구소 연구원(2019.2~현재)
[연구실적]
The Detection of Brand Identity and Image Using Semantic Network Analysis(2022)
(기상청) 기상융합서비스 정책 및 운영체제 개선을 위한 비즈니스모델 조사·분석(2021)
The Effects of Product’s Visual Preview and Customer Review on Sale Performance in Mobile Commerce (2021)
The Effects of Product’s Visual Preview on Customer Attention and Sales Using Convolution Neural Networks (2021)
A Study on the Factors Affecting Usage Intention of Digital Twin Technology in Product Design(2019)

임은택 의 다른 상품

품목정보

발행일
2022년 04월 15일
쪽수, 무게, 크기
452쪽 | 188*257*30mm
ISBN13
9788959728756

출판사 리뷰

저자 서문

2018년 정보화진흥원의 보고서에서는 데이터 수집, 저장, 가공, 분석 및 활용하는 과정에서 데이터를 활용함으로써 기업의 새로운 시장 확보, 새로운 고객 확보, 기업내ㆍ외부 프로세스 최적화와 공공에서의 사회적 서비스 비용 감소, 시민 맞춤형 공공서비스 개발 등 사회 전반에 걸친 분야에 영향을 미칠 것으로 보았다.

기존 경제 시스템을 주도하던 자원은 점차 고갈되고 거래를 통해 부가가치를 창출하는 과정에서 점차 소진되는 특성을 가지고 있는 것과 달리, 4차 산업혁명의 핵심 자원인 데이터는 수집을 통한 생산 이후에도 고갈의 염려 없이 생산이 가능할 뿐만 아니라 데이터의 거래, 데이터를 활용한 부가가치를 창출하는 과정에서 소진의 염려가 없이 지속적으로 사용할 수 있다는 장점을 가지고 있다. 그렇기 때문에 자원의 보유(데이터의 수집과 저장)도 중요하지만 더 중요한 것은 보유한 데이터를 활용하여 새로운 기술과 서비스, 창의적 비즈니스 모델을 창출해낼 수 있는 전략적인 경험과 창의적 사고능력이 중요해진 것이다.

데이터를 이용하여 혁신적인 가치를 창출하는 데이터 과학자는 4차 산업혁명의 중요한 인력으로 평가받고 있다. 이러한 데이터 과학자가 보유해야 하는 역량에는 조금씩 차이가 존재할 수 있겠지만 데이터 수집 및 관리와 같은 컴퓨팅 능력, 통계 및 데이터 분석 알고리즘 이해 및 시각화와 같은 데이터 분석 능력, 데이터를 활용하고자 하는 분야의 도메인 지식이 필요하며, 기업에서는 또한 이러한 능력을 갖춘 인재를 영입하기 위해 많은 비용을 사용하고 있다. 이러한 분위기 속에서 시중의 많은 데이터 분석과 데이터 과학에 대한 교재는 주로 데이터 분석 코드와 알고리즘에 관한 책을 쏟아내고 있다.
그러나 이러한 변화에도 불구하고 21년 정보통신정책연구원이 국내의 152개의 기업을 대상으로 AI 수요에 대한 설문조사를 한 결과, 기업은 사업 구체화, 문제정의, AI에 대한 이해, 도메인과 AI 기술의 결합, 모델 고도화를 위한 인재의 부족으로 인해 AI 도입을 꺼릴 뿐만 아니라 도입 후에도 많은 어려움을 겪고 있다는 결과를 보여주고 있다. 이에 대한 대응으로 클릭만으로 머신러닝(Machine Learning: ML) 모델을 활용하여 분석이 가능한 Auto ML 서비스뿐만 아니라, AI 기술을 기반으로 데이터의 수집과 관리, 운영 및 활용을 원활하게 할 수 있는 데이터플랫폼 서비스들이 등장함으로써 점차 범용적인 데이터 분석과 AI 모델의 활용이 가능할 것으로 예상하고 있다.

따라서 향후 비즈니스 환경에서 점차 보편적인 데이터 분석이 가능해진다면 도메인 지식과 전략적으로 데이터를 바라볼 수 있는 창의적인 사고를 바탕으로 문제를 정의하고 해결해가는 과정에 대해 이해하고 연습할 필요가 있다. 그러나 앞서 말한 것과 같이 시중의 많은 교재들은 데이터 분석을 위한 코드에 집중하고 있다. 본 교재에서는 코딩에 대하여 데이터 분석을 하는 첫 페이지에 QR코드를 통해서 R 또는 Python을 활용하여 교재의 분석내용을 구현한 코드를 제공하긴 하지만 데이터 분석을 위한 코딩에 대해서는 이야기하지 않는다. 가장 중요한 것은 데이터가 주어졌을 때 어떻게 문제를 정의하고, 문제를 해결하기 위한 과정을 연습해보고 경험을 하는 것이라고 보기 때문이다.

본 교재에서는 데이터 분석 경험이 많지 않은 독자들을 대상으로 R 또는 Python이 아닌 통계분석 소프트웨어인 SPSS를 활용하여 분석을 실시한다. SPSS는 클릭을 통해 빈도분석, 통계적 검증을 위한 t검정, 교차분석, 상관분석, 회귀분석뿐만 아니라 의사결정나무, 단층 신경망 등의 ML 기법까지 사용 가능하기 때문에 코딩을 사용한 데이터 분석이 낯선 학생들에게 가장 적합한 툴이라고 판단하였다.

데이터 분석을 위해서는 어떻게 문제를 정의하고, 문제를 해결하기 위해 어떠한 데이터를 수집하고 사용해야 할지 판단하는 것이 시작점이지만, 교재를 통해 데이터 수집까지 다루기엔 한계가 있기 때문에 본 교재에서는 Kaggle이라는 빅데이터 분석 커뮤니티에서 공개된 데이터를 활용한다. 2장에서는 Kaggle에서 공개된 데이터를 통해 어떻게 문제에 접근하고 분석이 가능한지 예제를 보여줌으로써 교재의 방향성을 설명하고자 하였다. 3~6장까지는 이진분류, 연속변수 예측, 현황분석, 이상탐지라는 큰 주제하에서 Kaggle에서 수집한 데이터를 분석 목적에 맞춰 분리하여 비슷한 문제를 해결하기 위해 어떻게 데이터를 바라보았는지, 어떤 분석을 사용하고 어떻게 결론을 내리고 있는지 보여주고자 하였다.

본 교재를 활용하여 코딩에 대하여 겁내지 않고 자신의 경영학적 또는 다양한 도메인 지식을 활용하여 문제를 파악하고, 문제를 해결하기 위해 데이터를 어떻게 분석하고 결론을 내는지에 대한 체험하는 과정을 통하여, 데이터 활용에 대한 전략적 사고와 창의적 사고 능력을 겸비한 많은 인재들이 양성될 수 있기를 희망한다.

리뷰/한줄평0

리뷰

첫번째 리뷰어가 되어주세요.

한줄평

첫번째 한줄평을 남겨주세요.

28,000
1 28,000