확장메뉴
주요메뉴


소득공제
미리보기 공유하기

데이터 분석의 모든 것

: 입문자를 위한 개념 이해부터 정형·비정형 데이터 분석까지

리뷰 총점9.6 리뷰 10건 | 판매지수 1,068
베스트
IT 모바일 top100 1주
정가
30,000
판매가
27,000 (10% 할인)
YES포인트
eBook이 출간되면 알려드립니다. eBook 출간 알림 신청
소중한 당신에게 5월의 선물 - 산리오 3단 우산/디즈니 우산 파우치/간식 접시 머그/하트 이중 머그컵
월간 개발자 2022년 5월호
내일은 개발자! 코딩테스트 대비 도서전
5월 전사
5월 쇼핑혜택
1 2 3 4 5

품목정보

품목정보
출간일 2021년 02월 15일
쪽수, 무게, 크기 600쪽 | 188*257mm
ISBN13 9791197347009
ISBN10 1197347003

이 상품의 태그

책소개 책소개 보이기/감추기

데이터 분석은 기초 통계, R 입문에 대한 선행학습을 필요로 합니다. 그런데 각각의 책으로 선행학습을 하다 보면 데이터 분석에 들어가기도 전에 포기를 하는 상황을 맞이합니다.
이 책은 데이터 분석에 꼭 필요한 기초 통계, 데이터 과학을 한 권에 담아서 데이터 분석에 지체 없이 진입하게 돕고, 데이터 분석의 큰 그림을 보여줍니다

목차 목차 보이기/감추기

Part 1. 비전공자를 위한 기초 지식(통계, R)
____Chapter 1. 기초 통계
________1.1 통계 개요
____________1.1.1 통계학의 중요 용어와 개념
____________1.1.2 통계 자료의 획득 방법
________1.2 기초 통계량과 확률
____________1.2.1 집중화 경향 대표값
____________1.2.2 분산도
____________1.2.3 확률 이론
________1.3 정규분포와 정규화
____________1.3.1 정규분포
____________1.3.2 표준화
________1.4 가설 검정
____________1.4.1 통계적 가설
____________1.4.2 가설 검정
________연습문제

____Chapter 2. R 프로그래밍
________2.1 프로그래밍 환경 만들기
____________2.1.1 프로그래밍 언어, R
____________2.1.2 R 설치하기
____________2.1.3 R Studio 설치하기
____________2.1.4 R 패키지 설치하기
________2.2 변수와 데이터 타입
____________2.2.1 변수
____________2.2.2 데이터 타입
________2.3 데이터 구조
____________2.3.1 백터
____________2.3.2 매트릭스(행렬)
____________2.3.3 데이터프레임
____________2.3.4 배열
____________2.3.5 리스트
________2.4 R 기초 프로그래밍
____________2.4.1 연산
____________2.4.2 흐름 제어문
____________2.4.3 함수
____________2.4.4 유용한 함수와 상수
________2.5 R을 이용한 데이터 조작 방법
____________2.5.1 데이터의 대략적인 특징 파악에 유용한 함수
____________2.5.2 외부 파일 읽기
____________2.5.3 데이터 추출
____________2.5.4 데이터 구조 변경
________연습문제


Part 2. 데이터 마트와 통계 분석
____Chapter 3. 탐색적 데이터 분석 개요
________3.1 탐색적 데이터 분석 개요
____________3.1.1 데이터 대표값 탐색
____________3.1.2 데이터 분산도 탐색
____________3.1.3 데이터 분포 탐색
____________3.1.4 변수 간 관계 탐색
________연습문제

____Chapter 4. 데이터 준비(전처리)
________4.1 데이터 전처리
____________4.1.1 데이터 변환, 처리
____________4.1.2 결측값 처리
____________4.1.3 이상값 검색
____________4.1.4 데이터 정규화
________4.2 차원 축소
____________4.2.1 차원 축소의 필요성
____________4.2.2 주성분분석
____________4.2.3 요인분석
________4.3 변수 선택
____________4.3.1 변수 선택 방법
____________4.3.2 상관계수
____________4.3.3 카이제곱검정
____________4.3.4 0에 가까운 분산
________연습문제

____Chapter 5. 통계 기반 데이터 분석
________5.1 기술 통계와 추론 통계
____________5.1.1 기술 통계
____________5.1.2 추론 통계
________5.2 상관분석
____________5.2.1 분석 방법
____________5.2.2 상관계수 검정
________5.3 선형회귀분석
____________5.3.1 단순선형회귀
____________5.3.2 다중선형회귀
____________5.3.3 모델 진단 그래프
____________5.3.4 회귀분석 모델의 체크사항
________5.4 시계열분석
____________5.4.1 시계열 데이터 개요
____________5.4.2 정상성
____________5.4.3 비정상 시계열을 정상 시계열로 전환하는 방법
____________5.4.4 시계열 모델
________5.5 주성분분석
____________5.5.1 주성분분석 개요
____________5.5.2 주성분분석 과정 설명
____________5.5.3 주성분분석 목적
____________5.5.4 주성분분석의 예
____________5.5.5 주성분분석 해석
____________5.5.6 적절한 주성분 개수 선택법
________연습문제


Part 3. 정형 데이터 마이닝
____Chapter 6. 분류분석
________6.1 데이터 마이닝
____________6.1.1 데이터 마이닝의 개념
____________6.1.2 데이터 마이닝의 대표적 기능
____________6.1.3 데이터 마이닝 추진 단계
____________6.1.4 분류분석의 주요 모델
________6.2 의사결정나무
____________6.2.1 의사결정나무 모델의 개념
____________6.2.2 분류 변수와 분류 기준값의 선택 방법
____________6.2.3 의사결정나무의 구조
____________6.2.4 의사결정나무 분석 예제(rpart() 함수)
____________6.2.5 의사결정나무 분석 예제(ctree() 함수)
________6.3 로지스틱 회귀
____________6.3.1 로지스틱 회귀 모델의 개념
____________6.3.2 로지스틱 회귀 모델 예제(glm() 함수)
________6.4 인공신경망
____________6.4.1 인공신경망 모델의 개념
____________6.4.2 단층신경망
____________6.4.3 다층신경망
____________6.4.4 피드포워드신경망
____________6.4.5 인공신경망 분석 예제(nnet() 함수)
____________6.4.6 인공신경망 분석 예제(neuralnet() 함수)
________6.5 앙상블
____________6.5.1 앙상블 모델의 개념
____________6.5.2 배깅과 분석 예제(bagging() 함수)
____________6.5.3 부스팅과 분석 예제(adabag::boosting() 함수)
____________6.5.4 랜덤 포레스트와 분석 예제(randomForest() 함수)
________6.6 서포트 벡터 머신
____________6.6.1 서포트 벡터 머신 모델의 개념
____________6.6.2 서포트 벡터 머신 분석 예제(ksvm() 함수)
____________6.6.3 서포트 벡터 머신 분석 예제(svm() 함수)
________6.7 나이브 베이즈
____________6.7.1 나이브 베이즈 모델의 개념
____________6.7.2 나이브 베이즈 분석 예제(naiveBayes() 함수)
________6.8 k-최근접 이웃
____________6.8.1 k-최근접 이웃 모델의 개념
____________6.8.2 k-최근접 이웃 분석 예제(knn() 함수)
____________6.8.1 k-최근접 이웃 분석 예제(kknn() 함수)
________연습문제

____Chapter 7. 분류분석 모델 평가
________7.1 정오분류표
____________7.1.1 분류분석 모델 평가를 위한 고려사항
____________7.1.2 정오분류표
____________7.1.3 신경망, 의사결정나무, 랜덤 포레스트 모델을 비교 평가하는 예제
________7.2 ROC 곡선과 AUC
____________7.2.1 ROC 곡선과 AUC의 개념
____________7.2.2 ROC 곡선과 AUC를 계산하여 모델을 평가하는 예제
____________7.2.3 세 가지 분류분석 모델의 평가를 하나의 ROC 곡선으로 비교하는 예제
________7.3 이익도표와 향상도 곡선
____________7.3.1 이익도표와 향상도 곡선의 개념
____________7.3.2 이익도표와 향상도 곡선을 그린 예제
________7.4 데이터 추출 방법
____________7.4.1 홀드아웃과 홀드아웃 예제
____________7.4.2 교차검증과 교차검증 예제
____________7.4.3 붓스트랩과 붓스트랩 예제
________7.5 클래스 불균형
____________7.5.1 클래스 불균형의 개념과 예제
____________7.5.2 업샘플링과 예제
____________7.5.3 다운샘플링과 예제
____________7.5.4 SMOTE와 예제
________연습문제

____Chapter 8. 군집분석과 연관분석
________8.1 군집분석
____________8.1.1 계층적 군집분석
____________8.1.2 k-평균 군집분석
____________8.1.3 혼합분포 군집분석
____________8.1.4 SOM 군집분석
____________8.1.5 SOM 군집분석 예제
________8.2 연관분석
____________8.2.1 연관규칙분석
________연습문제


Part 4. 비정형 데이터 마이닝

____Chapter 9. 텍스트 마이닝
________9.1 텍스트 마이닝 개요
____________9.1.1 텍스트 마이닝의 개념
____________9.1.2 텍스트의 위계적 구조
____________9.1.3 단어 표현 방법
____________9.1.4 텍스트 마이닝의 기능
________9.2 텍스트 마이닝 기본 프로세스
____________9.2.1 텍스트 수집
____________9.2.2 텍스트 전처리
________9.3 유사도 거리
____________9.3.1 유사도 거리 함수
____________9.3.2 유사도 거리를 계산하는 예제
________9.4 워드 클라우드
____________9.4.1 워드 클라우드
________9.5 감성분석
____________9.5.1 김성분석
________9.6 카운터 기반의 단어 표현
____________9.6.1 원-핫 인코딩
____________9.6.2 백오브워드
____________9.6.3 단어 빈도-역문서 빈도
________9.7 워드 임베딩을 위한 단어 표현
____________9.7.1 워드투벡터
____________9.7.2 글로브
________연습문제

____Chapter 10. 사회연결망 분석
________10.1 사회연결망 개요
____________10.1.1 사회연결망 개념
____________10.1.2 중심성
____________10.1.3 사회연결망 예제(대통령 브리핑 486~488.txt)
________연습문제

____부록
________정답 및 해설
________참고문헌
________찾아보기

저자 소개 (2명)

출판사 리뷰 출판사 리뷰 보이기/감추기

”대학에서 지리학을 전공하고 졸업과 동시에 [공공 빅데이터 청년 인턴십 1기] 교육과정을 수료했습니다. 빅데이터 분야를 목표로 하는 비전공자로서 이전에도 통계 및 R 프로그래밍 책을 여러 권 접해 보았지만 책을 따라가기에 급급했고, 지나고 보면 머릿속에 크게 남는 것이 없었습니다. 그렇지만 이 책은 기초 통계를 시작으로 데이터 분석에 필요한 개념을 먼저 짚어주고 이후에 충분한 실습을 하게 했습니다. 그 결과 학습을 마친 지금도 기억에 많이 남아 있네요. 무엇보다 저처럼 비전공자가 처음 접하는 용어가 쉽게 설명되어 있어서 큰 도움이 되었습니다.” _정원화

“대학에서 전자공학을 전공하고 [공공 빅데이터 청년 인턴십 1기] 교육과정을 수료했습니다. 비전공자이기 때문에 교육과정을 이수하면서 어려움이 많았는데 이 책은 그때 어려움을 겪었던 통계 지식, 분석 기법, 데이터 처리 방법 등이 구글링을 하지 않아도 될 만큼 자세히 써져 있어 매력적입니다. 데이터 분석 분야에서는 통계 지식이 매우 중요한 만큼 저처럼 통계 기초가 잡히지 않은 분에게 추천합니다.” _장승일

“대학에서 정보통계학을 전공하고 [공공 빅데이터 청년 인턴십 1기] 교육과정을 수료했습니다. 이 책은 기초 통계, 함수 사용 방법, 분석 기법에 대해서 친절하게 설명되어 있습니다. 교육과정 동기 수료생들을 보니 통계를 어려워하더군요. 기초 통계를 완벽하게 다지고 싶은 분, 그리고 분석 기법을 제대로 공부하고 싶은 분에게 추천 드립니다.” _정지서

회원리뷰 (10건) 리뷰 총점9.6

혜택 및 유의사항?
구매 포토리뷰 [도서] 데이터 분석의 모든 것 내용 평점5점   편집/디자인 평점5점 YES마니아 : 로얄 | 2021.04.30 | 추천0 | 댓글0 리뷰제목
통계학 전공자가 아니지만 실무에 데이터 분석이 필요하여 공부를 하기 위해 이 책을 구매하게 되었습니다. 우선 '입문자를 위한 개념 이해부터 정형, 비정형 데이터 분석까지'란 문구를 보고 기초지식이 부족하지만 입문자를 위한 책이여서 개념정리가 잘되어 있을거라 생각하고 구매하였습니다.  데이터 분석 입문자에게 꼭 필요한 지식인 통계, R프로그;
리뷰제목

통계학 전공자가 아니지만 실무에 데이터 분석이 필요하여 공부를 하기 위해 이 책을 구매하게 되었습니다.

우선 '입문자를 위한 개념 이해부터 정형, 비정형 데이터 분석까지'란 문구를 보고 기초지식이 부족하지만 입문자를 위한 책이여서 개념정리가 잘되어 있을거라 생각하고 구매하였습니다. 

데이터 분석 입문자에게 꼭 필요한 지식인 통계, R프로그래밍, 데이터 분석 등에 관한 내용이 잘 정리되어 있고 개념을 이해하기 쉬웠고, 데이터 분석에 많이 사용되는 R프로그래밍 코드 실습을 통해 실무에도 활용이 가능하여 큰 도움이 될 것이라 예상합니다.

댓글 0 이 리뷰가 도움이 되었나요? 공감 0
구매 다양한 용도로 활용 가능한 데이터 분석 입문서 내용 평점5점   편집/디자인 평점5점 즐***상 | 2021.04.30 | 추천0 | 댓글0 리뷰제목
비전공자의 입장에서 느끼기에는 기초 통계부터 실습까지 쉽게 다가갈 수 있어서 좋았습니다. 또한 데이터 분석, 머신 러닝, 딥러닝, 자연어처리까지 많은 내용들을 쉽게 쉽게 설명을 해주셔서 이해하기 편안했고 큰 도움이 되었습니다.   ADP나 ADSP, 빅데이터 분석기사와 같은 자격증 시험과 관련된 도서에 있는 내용들이 대부분 담겨 있기에 함께 활용을 해도 매우 좋을 것 같;
리뷰제목

비전공자의 입장에서 느끼기에는 기초 통계부터 실습까지 쉽게 다가갈 수 있어서 좋았습니다.

또한 데이터 분석, 머신 러닝, 딥러닝, 자연어처리까지 많은 내용들을 쉽게 쉽게 설명을 해주셔서 이해하기 편안했고 큰 도움이 되었습니다.

 

ADP나 ADSP, 빅데이터 분석기사와 같은 자격증 시험과 관련된 도서에 있는 내용들이 대부분 담겨 있기에 함께 활용을 해도 매우 좋을 것 같습니다.

댓글 0 이 리뷰가 도움이 되었나요? 공감 0
구매 포토리뷰 데이터 분석은 이 책 한권이면 충분해요... 내용 평점5점   편집/디자인 평점5점 YES마니아 : 로얄 썽**탱 | 2021.04.30 | 추천0 | 댓글0 리뷰제목
영화 '기생충'에서 많은 사람들이 왜 제목이 '기생충'일까 궁금해했었다. 그리고 영화를 보고나서야 이것보다 더 적절한 제목은 없다고들 했다. '데이터 분석의 모든 것' 또한 한 권으로 데이터 분석의 모든 것이 가능할까 궁금해할 수 있는데, 꼭 읽어보길 권한다.  데이터 분석서가 많지 않은데 여러 권 볼 필요가 없이 이 책 한권이면 충분하다. 특히, 각 챕터별 깊이;
리뷰제목

영화 '기생충'에서 많은 사람들이 왜 제목이 '기생충'일까 궁금해했었다. 그리고 영화를 보고나서야 이것보다 더 적절한 제목은 없다고들 했다. '데이터 분석의 모든 것' 또한 한 권으로 데이터 분석의 모든 것이 가능할까 궁금해할 수 있는데, 꼭 읽어보길 권한다. 

데이터 분석서가 많지 않은데 여러 권 볼 필요가 없이 이 책 한권이면 충분하다. 특히, 각 챕터별 깊이의 조절이 잘 되어있어 처음 접하는 입문자부터 데이터 분석을 접해본 전문가까지도 지루하지 않게 볼 수 있다. (챕터 마지막의 연습문제는 잘 이해했는지 확인하기에 매우 좋다. ^^;;;)

R 기반의 프로그래밍도 실습과 함께 실력을 향상시킬 수 있으며, 범위 또한 시각화까지 다루고 있어 한 권만 보면 데이터 분석의 기초 그 이상을 잡게 될 것이다.

약 600페이지 분량이라 많게 느껴질 수 있으나, 실습 코드들과 시각화 그래프들의 조화가 잘 되어서 그리 오래 걸리진 않는 듯 하니... 책상 근처에 두고 조금씩 이론과 실습을 병행하기에 딱  좋다.

빅데이터 분석을 시작한다면, '데이터 분석의 모든 것'으로 시작하길 추천한다.


 

댓글 0 이 리뷰가 도움이 되었나요? 공감 0

한줄평 (5건) 한줄평 총점 10.0

혜택 및 유의사항 ?
구매 평점5점
선물했어요 도움이되었음좋겠습니다^^
이 한줄평이 도움이 되었나요? 공감 0
g**********0 | 2021.08.05
구매 평점5점
R언어 기반으로 사례와 예제가 많아 ADSP/ADP 자격증 공부에도 도움이 됐습니다
이 한줄평이 도움이 되었나요? 공감 0
YES마니아 : 로얄 | 2021.04.30
구매 평점5점
데이터분석 입문자용으로 적합하고 사례가 많이 나와 있어서 좋습니다
이 한줄평이 도움이 되었나요? 공감 0
YES마니아 : 로얄 d***7 | 2021.04.28
  •  쿠폰은 결제 시 적용해 주세요.
1   27,000
뒤로 앞으로 맨위로 aniAlarm