품목정보
출간일 | 2017년 10월 25일 |
---|---|
쪽수, 무게, 크기 | 368쪽 | 668g | 183*235*30mm |
ISBN13 | 9791162240144 |
ISBN10 | 1162240148 |
출간일 | 2017년 10월 25일 |
---|---|
쪽수, 무게, 크기 | 368쪽 | 668g | 183*235*30mm |
ISBN13 | 9791162240144 |
ISBN10 | 1162240148 |
엑셀의 한계를 넘어 파이썬을 이용한 데이터 분석으로 엑셀은 쉽고 직관적이지만 수백 개의 파일을 다루기는 무리다. 파이썬을 이용하면 엑셀의 한계를 넘어 다양한 형식의 데이터를 가공하고 수많은 파일을 분석할 수 있다. 이 책은 일반인을 위한 파이썬 기초부터 CSV, 엑셀, 데이터베이스의 데이터를 분석하는 파이썬 코드 작성법까지 친절하게 알려준다. 파일 파싱, 그룹화, 통계 산출, 시각화에 필요한 각종 파이썬 라이브러리도 함께 알아본다. 데이터 분석 고수가 되겠다는 의지가 있다면 프로그래밍 경험은 필요 없다. |
CHAPTER 1 파이썬 기초 __1.1 파이썬 스크립트를 생성하는 방법 __1.2 파이썬 스크립트 실행 방법 __1.3 명령 줄에서 유용한 팁 몇 가지 __1.4 파이썬 기본 구성 요소 __1.5 텍스트 파일 읽기 __1.6 glob을 이용해 다수의 텍스트 파일 읽기 __1.7 텍스트 파일 쓰기 __1.8 print 문 __1.9 연습 문제 CHAPTER 2 CSV 파일 __2.1 기본 파이썬 대 팬더스 __2.2 CSV 파일 읽고 쓰기(파트1) __2.3 기본 문자열 파싱이 실패하는 경우 __2.4 CSV 파일 읽고 쓰기(파트2) __2.5 특정 행을 필터링하기 __2.6 특정 열 선택하기 __2.7 연속된 행 선택하기 __2.8 헤더 추가하기 __2.9 여러 개의 CSV 파일 읽기 __2.10 여러 파일의 데이터 합치기 __2.11 파일에서 데이터 값의 합계 및 평균 계산하기 __2.12 연습 문제 CHAPTER 3 엑셀 파일 __3.1 엑셀 통합 문서 내부 살펴보기 __3.2 단일 워크시트 처리 __3.3 통합 문서의 모든 워크시트 읽기 __3.4 엑셀 통합 문서에서 워크시트 집합 읽기 __3.5 여러 개의 통합 문서 처리하기 __3.6 연습 문제 CHAPTER 4 데이터베이스 __4.1 파이썬 내장 모듈 sqlite3 __4.2 MySQL 데이터베이스 __4.3 연습 문제 CHAPTER 5 응용 작업 __5.1 대량의 파일에서 원하는 집합 찾기 __5.2 CSV 파일에서 카테고리별 통계치 계산하기 __5.3 텍스트 파일에서 카테고리별 통계치 계산하기 __5.4 연습 문제 CHAPTER 6 데이터 시각화 __6.1 matplotlib __6.2 팬더스 __6.3 ggplot __6.4 seaborn CHAPTER 7 기술통계와 모델링 __7.1 데이터셋 __7.2 와인 품질 데이터셋 __7.3 고객 이탈 데이터셋 CHAPTER 8 스크립트 자동 실행 예약하기 __8.1 작업 스케줄러(윈도우) __8.2 크론 유틸리티(맥 OS 및 유닉스) CHAPTER 9 더 공부할 것들 __9.1 추가 표준 라이브러리 모듈과 내장 함수 __9.2 파이썬 패키지 인덱스(PyPI) 추가 모듈 __9.3 추가 자료구조 __9.4 더 공부해야 할 것들 |
비 전산 전공자의 파이썬 입문기여서 그런지 어떤 방식으로 전산 기초를 뛰어 넘고 책을 집필할 정도였는지 호기심을 가지고 있었다. 워낙 파이썬이 대세인데다가 데이터 사이언스니 머신러닝, 빅데이터 관련 분야가 전망이 밝다는 세간의 호들갑(?)에 부응하여 영접하고자 조우하였건만, 그닥 기대한만큼의 퀄리티를 얻었다는 느낌이 받지 못하였다.
다만 콤팩트한 분량으로 파이썬 기초부터 활용까지 다루었다는 측면에서 부담없이 접근이 가능하며, 파이썬을 실질적으로 활용하기 위해서는 엑셀, CSV등의 파일처리를 통해 하고자하는 통계분석등을 한달음에 꿸 수 있어야 처음에 가졌던 파이썬에 대한 기대감이 식기전에 또 다른 동기부여가 가능한데 그 부분에서 만큼은 일정부분 소기의 성과를 달성할 수 있을 것으로 보인다.
파이썬 데이터 분석 입문
(Foundations for Analytics with Python)
클린턴 브라운리 저 | 한창진, 이병욱 옮김
한빛미디어
CHAPTER 1 파이썬 기초
__1.1 파이썬 스크립트를 생성하는 방법
__1.2 파이썬 스크립트 실행 방법
__1.3 명령 줄에서 유용한 팁 몇 가지
__1.4 파이썬 기본 구성 요소
__1.5 텍스트 파일 읽기
__1.6 glob을 이용해 다수의 텍스트 파일 읽기
__1.7 텍스트 파일 쓰기
__1.8 print 문
__1.9 연습 문제
CHAPTER 2 CSV 파일
__2.1 기본 파이썬 대 팬더스
__2.2 CSV 파일 읽고 쓰기(파트1)
__2.3 기본 문자열 파싱이 실패하는 경우
__2.4 CSV 파일 읽고 쓰기(파트2)
__2.5 특정 행을 필터링하기
__2.6 특정 열 선택하기
__2.7 연속된 행 선택하기
__2.8 헤더 추가하기
__2.9 여러 개의 CSV 파일 읽기
__2.10 여러 파일의 데이터 합치기
__2.11 파일에서 데이터 값의 합계 및 평균 계산하기
__2.12 연습 문제
CHAPTER 3 엑셀 파일
__3.1 엑셀 통합 문서 내부 살펴보기
__3.2 단일 워크시트 처리
__3.3 통합 문서의 모든 워크시트 읽기
__3.4 엑셀 통합 문서에서 워크시트 집합 읽기
__3.5 여러 개의 통합 문서 처리하기
__3.6 연습 문제
CHAPTER 4 데이터베이스
__4.1 파이썬 내장 모듈 sqlite3
__4.2 MySQL 데이터베이스
__4.3 연습 문제
CHAPTER 5 응용 작업
__5.1 대량의 파일에서 원하는 집합 찾기
__5.2 CSV 파일에서 카테고리별 통계치 계산하기
__5.3 텍스트 파일에서 카테고리별 통계치 계산하기
__5.4 연습 문제
CHAPTER 6 데이터 시각화
__6.1 matplotlib
__6.2 팬더스
__6.3 ggplot
__6.4 seaborn
CHAPTER 7 기술통계와 모델링
__7.1 데이터셋
__7.2 와인 품질 데이터셋
__7.3 고객 이탈 데이터셋
CHAPTER 8 스크립트 자동 실행 예약하기
__8.1 작업 스케줄러(윈도우)
__8.2 크론 유틸리티(맥 OS 및 유닉스)
CHAPTER 9 더 공부할 것들
__9.1 추가 표준 라이브러리 모듈과 내장 함수
__9.2 파이썬 패키지 인덱스(PyPI) 추가 모듈
__9.3 추가 자료구조
__9.4 더 공부해야 할 것들
최근 들어 Google, Facebook에서 작성한 Bigdata 관련 논문들을 많이 접할 기회가 있었다.
Graph theory, Data visualization, Web searching, Text processing 등 여러 주제들 접하게 되었는데, 이 때 발견한 책이 파이썬 데이터 분석 입문 도서이다. Bigdata에 대해 관심을 가지고 처음 공부를 시작하는 입장에서 기대를 많이 한 책이다.
결론부터 말하면, 나에겐 맞지 않는 책이다. 그 이유를 나열하자면,
Python 도서라기에도, Data 분석에 관한 책이라고 하기에도 제목과 맞지 않다. 처음엔 python 기초를 설명하고, 추후엔 데이터 분석보단, python을 이용해서 하나하나 시각화나 몇가지 예제를 따라해 보는 정도가 전부이다.
데이터 분석에 대한 기초적인 이론 (Graph 이론 등)에 대해 기대한 나에게는 맞지 않는 책이였다.
Data load에 굉장히 많은 페이지를 할애하고 있다. 분명 data를 나의 program에 load하는 것은 중요할 수 있다. 하지만 분석을 위해 CSV파일, 엑셀 파일, 데이터 베이스 등에서 데이터를 읽고 프로그램에 load 하는 정도의 설명이 100여 페이지 가량된다. 차라리 기본적으로 File I/O 등에 익숙한 python 사용자를 대상으로 책을 작성했다면, 좀 더 많은 내용을 포함 할 수 잇지 않았을까?
데이터 시각화는 matplotlib, pandas, ggplot 등 어느 python 도서에도 포함하고 있는 내용들을 설명하고 있는데, 데이터 분석에 관한 내용이나 이론의 설명은 부족하고, 예제 코드를 실행하여 결과만 눈으로 확인하는 정도의 내용밖에 없다.
제목과 달리 데이터 분석에 관련된 내용을 거의 책에 존재하지 않는다.
아쉽지만, 정말 분석 위주의 내용을 원한다면, Facebook, Google등의 논문을 살펴볼 것은 추천한다.
이 글은 한빛미디어의 도서 리뷰 활동으로 작성된 글임으로 참고 바랍니다.