확장메뉴
주요메뉴


소득공제 PDF
미리보기 파트너샵보기 공유하기
eBook

파이썬 라이브러리를 활용한 데이터 분석 (2판)

: 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

[ PDF ]
리뷰 총점9.0 리뷰 2건 | 판매지수 600
정가
28,000
판매가
28,000(종이책 정가 대비 20% 할인)
YES포인트
구매 시 참고사항
{ Html.RenderPartial("Sections/BaseInfoSection/DeliveryInfo", Model); }
한 눈에 보는 YES24 단독 선출간
매월 1~7일 디지털머니 충전 시 보너스머니 2배 적립
★90일 대여점★ 이렇게 싸도 대여?
[READ NOW] 2022년 8월호
eBook 전종 10%할인+5%적립 무한발급 슈퍼쿠폰
8월 전사
쇼핑혜택
1 2 3 4 5

품목정보

품목정보
출간일 2019년 06월 30일
이용안내 ?
  •  배송 없이 구매 후 바로 읽기
  •  이용기간 제한없음
  •  TTS 불가능
  •  저작권 보호를 위해 인쇄 기능 제공 안함
지원기기 크레마, PC(윈도우), 아이폰, 아이패드, 안드로이드폰, 안드로이드패드, 전자책단말기(일부 기기 사용 불가), PC(Mac)
파일/용량 PDF(DRM) | 9.23MB ?
글자 수/ 페이지 수 약 665쪽?
ISBN13 9791162248522
KC인증

이 상품의 태그

소개 책소개 보이기/감추기

빅데이터 분석에 관한 가장 완벽한 교재!

이 책은 NumPy, pandas, matplotlib, IPython, Jupyter 등 다양한 파이썬 라이브러리를 사용해서 효과적으로 데이터를 분석하는 방법을 알려준다. pandas의 새로운 기능뿐만 아니라 메모리 사용량을 줄이고 성능을 개선하는 고급 사용법까지 다룬다. 또한 모델링 도구인 statsmodels와 scikit-learn 라이브러리도 소개한다. 연대별 이름 통계 자료, 미 대선 데이터베이스 자료 등 실사례로 따라 하다 보면 어느덧 여러분도 데이터에 알맞게 접근하고 효과적으로 분석하는 전문가가 될 것이다.

목차 목차 보이기/감추기

CHAPTER 1 시작하기 전에
__1.1 이 책에서 다루는 내용
__1.2 왜 데이터 분석에 파이썬을 사용하나
__1.3 필수 파이썬 라이브러리
__1.4 설치 및 설정
__1.5 커뮤니티와 컨퍼런스
__1.6 이 책을 살펴보는 방법

CHAPTER 2 파이썬 언어의 기본, IPython, 주피터 노트북
__2.1 파이썬 인터프리터
__2.2 IPython 기초
__2.3 파이썬 기초

CHAPTER 3 내장 자료구조, 함수, 파일
__3.1 자료구조와 순차 자료형
__3.2 함수
__3.3 파일과 운영체제
__3.4 마치며

CHAPTER 4 NumPy 기본: 배열과 벡터 연산
__4.1 NumPy ndarray: 다차원 배열 객체
__4.2 유니버설 함수: 배열의 각 원소를 빠르게 처리하는 함수
__4.3 배열을 이용한 배열지향 프로그래밍
__4.4 배열 데이터의 파일 입출력
__4.5 선형대수
__4.6 난수 생성
__4.7 계단 오르내리기 예제
__4.8 마치며

CHAPTER 5 pandas 시작하기
__5.1 pandas 자료구조 소개
__5.2 핵심 기능
__5.3 기술 통계 계산과 요약
__5.4 마치며

CHAPTER 6 데이터 로딩과 저장, 파일 형식
__6.1 텍스트 파일에서 데이터를 읽고 쓰는 법
__6.2 이진 데이터 형식
__6.3 웹 API와 함께 사용하기
__6.4 데이터베이스와 함께 사용하기
__6.5 마치며

CHAPTER 7 데이터 정제 및 준비
__7.1 누락된 데이터 처리하기
__7.2 데이터 변형
__7.3 문자열 다루기
__7.4 마치며

CHAPTER 8 데이터 준비하기: 조인, 병합, 변형
__8.1 계층적 색인
__8.2 데이터 합치기
__8.3 재형성과 피벗
__8.4 마치며

CHAPTER 9 그래프와 시각화
__9.1 matplotlib API 간략하게 살펴보기
__9.2 pandas에서 seaborn으로 그래프 그리기
__9.3 다른 파이썬 시각화 도구
__9.4 마치며

CHAPTER 10 데이터 집계와 그룹 연산
__10.1 GroupBy 메카닉
__10.2 데이터 집계
__10.3 Apply: 일반적인 분리-적용-병합
__10.4 피벗테이블과 교차일람표
__10.5 마치며

CHAPTER 11 시계열
__11.1 날짜, 시간 자료형, 도구
__11.2 시계열 기초
__11.3 날짜 범위, 빈도, 이동
__11.4 시간대 다루기
__11.5 기간과 기간 연산
__11.6 리샘플링과 빈도 변환
__11.7 이동창 함수
__11.8 마치며

CHAPTER 12 고급 pandas
__12.1 Categorical 데이터
__12.2 고급 GroupBy 사용
__12.3 메서드 연결 기법
__12.4 마치며

CHAPTER 13 파이썬 모델링 라이브러리
__13.1 pandas와 모델 코드의 인터페이스
__13.2 Patsy를 이용해서 모델 생성하기
__13.3 statsmodels 소개
__13.4 scikit-learn 소개
__13.5 더 공부하기

CHAPTER 14 데이터 분석 예제
__14.1 Bit.ly의 1.USA.gov 데이터
__14.2 MovieLens의 영화 평점 데이터
__14.3 신생아 이름
__14.4 미국농무부 영양소 정보
__14.5 2012년 연방선거관리위원회 데이터베이스
__14.6 마치며

APPENDIX A 고급 NumPy
__A.1 ndarray 객체 구조
__A.2 고급 배열 조작 기법
__A.3 브로드캐스팅
__A.4 고급 ufunc 사용법 .
__A.5 구조화된 배열과 레코드 배열
__A.6 정렬에 관하여
__A.7 umba를 이용하여 빠른 NumPy 함수 작성하기
__A.8 고급 배열 입출력
__A.9 성능 팁

APPENDIX B IPython 시스템 더 알아보기
__B.1 명령어 히스토리 사용하기
__B.2 운영체제와 함께 사용하기
__B.3 소프트웨어 개발 도구
__B.4 IPython을 이용한 생산적인 코드 개발에 관한 팁
__B.5 IPython 고급 기능
__B.6 마치며

저자 소개 (2명)

출판사 리뷰 출판사 리뷰 보이기/감추기

※ 『파이썬 라이브러리를 활용한 데이터 분석』 드디어 개정!
이 책의 초판이 출간된 2012년은 pandas 개발 초기로, 파이썬용 오픈소스 데이터 분석 라이브러리가 흔하지 않았습니다. 이번에 pandas의 새로운 기능과 5년여간의 세월이 흐르는 동안 낡았거나 사용법이 바뀐 내용을 모두 반영하여 책 전반을 다시 다듬었습니다. 또한 당시에는 존재하지 않았거나 책에 싣기에는 불안했던 갓 나온 도구들을 새로 소개하는 내용을 추가했습니다. 2판의 주요 변경 사항은 다음과 같습니다.

· 모든 코드를 파이썬 3.6 기반으로 수정
· 아나콘다 파이썬 배포판과 몇몇 필수 파이썬 패키지로 설치
· 최신 pandas 라이브러리 사용
· pandas 고급 사용법과 사용팁 추가
· statsmodels와 scikit-learn 라이브러리 소개

※ 이 책에서 다루는 내용
이 책은 파이썬으로 데이터를 다루는 다양하고 기본적인 방법을 소개합니다. 그러기 위해 파이썬 프로그래밍 언어의 일부와 데이터 분석 문제를 효율적으로 해결하는 데 도움이 되는 몇 가지 라이브러리를 다룹니다. ‘데이터 분석’이 이 책의 제목이긴 하지만 데이터 분석 방법론이 아니라 파이썬 프로그래밍, 라이브러리, 도구에 집중합니다. 주요 내용은 다음과 같습니다.

· IPython 셸, 주피터 노트북 사용하기
· NumPy 기본 및 고급 기능 알아보기
· pandas로 데이터 분석 입문하기
· 유연한 도구를 사용해 데이터 로딩, 정제, 조인, 병합, 변형하기
· matplotlib으로 유용한 시각화 만들기
· pandas groupby 기능을 적용해 데이터를 나누고 요약하기
· 시계열 데이터 분석 및 조작하기

eBook 회원리뷰 (2건) 리뷰 총점9.0

혜택 및 유의사항?
사이킷런 머신러닝의 전반적인 흐름잡기 제격! 내용 평점5점   편집/디자인 평점5점 s*****n | 2022.03.23 | 추천0 | 댓글0 리뷰제목
이 책은 2019년에 나왔던 책의 개정판이라고 한다. 1판과 달리 2판에서는 사이킷런 1.0버전에 맞게 바뀐 내용을 표기해서 적고 있고, 책의 전반적인 내용도 머신러닝을 다루고 있기에 사이킷런에 대한 모든 클래스와 함수들을 살펴보는데 주력을 하고 있다. 이 책의 가장 좋은 점은 물 흐르듯 설명을 이어나간다는 점을 들 수 있을 것 같다. 코드와 이론을 병행하면서 모델에 대한 기본;
리뷰제목

이 책은 2019년에 나왔던 책의 개정판이라고 한다. 1판과 달리 2판에서는 사이킷런 1.0버전에 맞게 바뀐 내용을 표기해서 적고 있고, 책의 전반적인 내용도 머신러닝을 다루고 있기에 사이킷런에 대한 모든 클래스와 함수들을 살펴보는데 주력을 하고 있다.


이 책의 가장 좋은 점은 물 흐르듯 설명을 이어나간다는 점을 들 수 있을 것 같다. 코드와 이론을 병행하면서 모델에 대한 기본적인 이해를 사용한 후 어떤 상황에서 어떤 함수를 써야하는지를 코드로 보여주고 있어 지식과 실습을 겸비할 수 있어 무척 좋다고 느껴졌다.

또한 어떻게 데이터를 전처리 하는지를 데이터의 유형에 따라 세부적으로 나뉘었으며, 이를 바탕으로 어떤 모델을선택할지, 어떤식으로 분석할지 일련의 과정을 하나하나 세세히 설명하고 있어, 정말 이 책 한권이면 추후에 어느 모델로 어떤 데이터를 분석하더라도 금방금방 찾아서 확인할수 있을 좋은 내용의 책이란게 느껴졌다. O'REILLY에서 낸 건 늘 믿을만 했는데, 이번 책에서도 그 점이 잘 느껴졌다.


사실 최근 딥러닝이 주목을 받기에 상대적으로 단순하다고 느껴지는 머신러닝이 덜 주목을 받고 있어 나조차도 관심이 소홀하다고 느껴지는게 많았는데, 이 책의 내용을 차근차근 살펴보니 생각보다 정리해야하는 내용이 많다는것이 느껴졌고, 그만큼 알차고 좋은 내용이 많다는 것도 잘 다가왔다. 머신러닝의 모델 뿐 아니라 어떤 식으로 더 고도화를 할지, 더 적합한 데이터셋을 만드는지에 대한 노하우도 잘 실려있어서 전반적인 모델을 사용한 프로젝트에 큰 도움을 줄 수 있다고 느껴진다.

댓글 0 이 리뷰가 도움이 되었나요? 공감 0
구매 파이썬 라이브러리를 활용한 데이터 분석 (2판) 내용 평점4점   편집/디자인 평점4점 d**p | 2020.03.26 | 추천0 | 댓글0 리뷰제목
책 내용은 numpy, pandas의 기초부터 필수적인 사용법을 잘 정리하여 예제 코드로 보여 주고 있습니다. 다만 일부 번역에서 일관성이 없고(어디에선 색인, 어디에선 인덱스), 번역 설명이 너무 함축적이라 이해가 바로 되지 않습니다. 번역을 한다는게 항상 아쉬운 부분이 있을 수 밖에 없는데, 조금 풀어서 설명했으면 어땠을까 아쉽네요. 이를테면 Series 관련 이미 알고 있;
리뷰제목

책 내용은 numpy, pandas의 기초부터 필수적인 사용법을 잘 정리하여 예제 코드로 보여 주고 있습니다. 다만 일부 번역에서 일관성이 없고(어디에선 색인, 어디에선 인덱스), 번역 설명이 너무 함축적이라 이해가 바로 되지 않습니다. 번역을 한다는게 항상 아쉬운 부분이 있을 수 밖에 없는데, 조금 풀어서 설명했으면 어땠을까 아쉽네요. 이를테면 Series 관련 이미 알고 있는 내용인데도, 이 책의 설명을 보면서 무엇을 설명하려 한 것인지 혼란을 느꼈습니다. 다른 예로 책에 나오는 "재형성"이라는 너무도 낯선 용어 때문에 원문을 찾아보니 Reshaping이란 단어였습니다. 또한 Drop() 함수를 번역한 설명 부분은 아예 반대로 번역한 오류도 있습니다. 이 밖에도 번역에 따른 오류가 여럿 보였습니다. 초심자에게 이런 부분은 큰 오류입니다. 구매자 분은 코드를 먼저 보면서 의도를 파악하고 학습하시길 바랍니다.


책 전부 읽고 추가로 리뷰 작성하니다. 전체적으로 코드의 동작에 대한 설명이 명료하지 못합니다. 원문을 아무 생각없이 번역한 듯한 느낌입니다. 이해를 돕기 위한 의역이나 첨언을 단 느낌이 전혀 없으며, 번역 과정에서 번역기를 통해 아무 생각 없이 작성한 느낌이 강하게 듭니다. 별점 2점으로 수정합니다.

댓글 0 이 리뷰가 도움이 되었나요? 공감 0

한줄평 (1건) 한줄평 총점 10.0

혜택 및 유의사항 ?
구매 평점5점
좋은 책입니다.
이 한줄평이 도움이 되었나요? 공감 0
YES마니아 : 골드 나* | 2020.05.27
뒤로 앞으로 맨위로 aniAlarm