확장메뉴
주요메뉴


소득공제 PDF
파이썬 데이터 클리닝 쿡북
eBook

파이썬 데이터 클리닝 쿡북

: 파이썬과 판다스를 활용한 데이터 전처리

[ PDF ]
첫번째 리뷰어가 되어주세요 | 판매지수 156
정가
22,400
판매가
22,400(종이책 정가 대비 20% 할인)
구매 시 참고사항
  • 2020.4.1 이후 구매 도서 크레마터치에서 이용 불가, PC 뷰어 이용시 하이라이트 기능 사용 불가
{ Html.RenderPartial("Sections/BaseInfoSection/DeliveryInfo", Model); }

품목정보

품목정보
발행일 2023년 07월 10일
이용안내 ?
지원기기 크레마, PC(윈도우 - 4K 모니터 미지원), 아이폰, 아이패드, 안드로이드폰, 안드로이드패드, 전자책단말기(일부 기기 사용 불가), PC(Mac)
파일/용량 PDF(DRM) | 5.68MB ?
글자 수/ 페이지 수 약 388쪽?
ISBN13 9791158394493

이 상품의 태그

Clean Code(클린 코드)

Clean Code(클린 코드)

26,400 (0%)

'Clean Code(클린 코드)' 상세페이지 이동

실용주의 프로그래머

실용주의 프로그래머

26,400 (0%)

'실용주의 프로그래머' 상세페이지 이동

프로그래머의 뇌

프로그래머의 뇌

16,800 (0%)

'프로그래머의 뇌' 상세페이지 이동

한 권으로 읽는 컴퓨터 구조와 프로그래밍

한 권으로 읽는 컴퓨터 구조와 프로그래밍

28,000 (0%)

'한 권으로 읽는 컴퓨터 구조와 프로그래밍' 상세페이지 이동

CODE(코드)

CODE(코드)

20,000 (0%)

'CODE(코드)' 상세페이지 이동

그로스 해킹

그로스 해킹

11,100 (0%)

'그로스 해킹' 상세페이지 이동

Code Complete 코드 컴플리트 2

Code Complete 코드 컴플리트 2

38,000 (0%)

'Code Complete 코드 컴플리트 2' 상세페이지 이동

파이썬 데이터 클리닝 쿡북

파이썬 데이터 클리닝 쿡북

22,400 (0%)

'파이썬 데이터 클리닝 쿡북' 상세페이지 이동

심층 학습

심층 학습

29,400 (0%)

'심층 학습' 상세페이지 이동

웹 애플리케이션 보안

웹 애플리케이션 보안

24,000 (0%)

'웹 애플리케이션 보안' 상세페이지 이동

알고리즘 개정4판

알고리즘 개정4판

48,000 (0%)

'알고리즘 개정4판' 상세페이지 이동

소개 책소개 보이기/감추기

목차 목차 보이기/감추기

▣ 01장: 표 데이터를 판다스로 가져올 때의 데이터 정제
___1.1 CSV 파일 가져오기
___1.2 엑셀 파일 가져오기
___1.3 SQL 데이터베이스의 데이터를 가져오기
___1.4 SPSS, Stata, SAS 데이터 가져오기
___1.5 R 데이터 가져오기
___1.6 표 데이터 저장

▣ 02장: HTML과 JSON을 판다스로 가져올 때의 데이터 정제
___2.1 단순한 JSON 데이터 가져오기
___2.2 API를 통해 복잡한 JSON 데이터 가져오기
___2.3 웹페이지의 데이터 가져오기
___2.4 JSON 데이터 저장

▣ 03장: 데이터 측정
___3.1 처음 데이터를 훑어보기
___3.2 열을 선택하고 정돈하기
___3.3 행을 선택하기
___3.4 범주형변수의 빈도를 생성하기
___3.5 연속변수의 요약통계 생성하기

▣ 04장: 데이터의 부분집합에서 누락값과 이상값 식별
___4.1 누락값 찾기
___4.2 변수가 1개인 이상값 식별하기
___4.3 이변량 관계의 이상값과 예상치 못한 값 식별하기
___4.4 부분집합을 이용해 변수 간의 논리적 불일치를 찾기
___4.5 선형 회귀를 활용해 유의한 영향을
___4.6 k-최근접 이웃을 활용해 이상값을 찾기
___4.7 아이솔레이션 포레스트를 활용한 이상 탐지

▣ 05장: 시각화를 활용해 예상치 못한 값을 식별하기
___5.1 히스토그램을 활용해 연속변수의 분포를 조사하기
___5.2 박스플롯을 활용해 연속변수의 이상값을 식별하기
___5.3 그룹별 박스플롯으로 특정 그룹에서 예상치 못한 값을 드러내기
___5.4 바이올린 플롯으로 분포 형태와 이상값을 조사하기
___5.5 산점도를 활용해 이변량 관계를 보기
___5.6 라인 플롯으로 연속변수의 추세를 조사하기
___5.7 상관행렬을 기반으로 히트맵을 작성하기

▣ 06장: 데이터 정제, 탐색 및 시리즈 연산
___6.1 판다스 시리즈에서 값을 얻기
___6.2 판다스 시리즈에 대한 요약통계 표시
___6.3 시리즈 값 변경
___6.4 조건에 따라 시리즈 값을 변경
___6.5 문자열 시리즈 데이터 평가와 정제
___6.6 날짜 다루기
___6.7 누락 데이터 식별과 정제
___6.8 k-최근접 이웃으로 누락값 대치

▣ 07장: 집계 시 지저분한 데이터 다루기
___7.1 itertuples을 활용한 데이터 순회(안티 패턴)
___7.2 넘파이 배열의 그룹별 요약을 계산
___7.3 groupby를 사용해 데이터를 그룹별로 조직화하기
___7.4 좀 더 복잡한 집계 함수를 groupby와 함께 사용하기
___7.5 사용자 정의 함수 및 apply와 groupby
___7.6 groupby를 사용해 데이터프레임의 분석 단위를 바꾸기

▣ 08장: 데이터프레임들을 결합할 때의 데이터 문제 해결
___8.1 데이터프레임을 수직으로 결합하기
___8.2 일대일 병합
___8.3 병합 기준 열을 여러 개 사용하기
___8.4 일대다 병합
___8.5 다대다 병합
___8.6 병합 루틴 개발

▣ 09장: 데이터 타이딩과 리셰이핑
___9.1 중복 행 제거하기
___9.2 다대다 관계 수정하기
___9.3 stack과 melt로 넓은 데이터를 긴 포맷으로 리셰이핑
___9.4 열 그룹을 녹이기
___9.5 unstack과 pivot을

▣ 10장: 사용자 정의 함수와 클래스로 데이터 정제를 자동화
___10.1 데이터를 처음 살펴보는 함수
___10.2 요약통계와 빈도를 표시하는 함수
___10.3 이상치와 예상치 못한 값을 식별하는 함수
___10.4 데이터 집계와 결합을 위한 함수
___10.5 시리즈 값을 업데이트하는 로직을 담은 클래스
___10.6 표 형태가 아닌 데이터 구조를 다루는 클래스

출판사 리뷰 출판사 리뷰 보이기/감추기

★ 이 책에서 다루는 내용 ★

◎ 다양한 데이터 소스로부터 데이터를 읽고 분석하는 법
◎ 데이터프레임, 열, 행의 어트리뷰트를 요약하는 법
◎ 데이터를 필터링하고 주어진 요건을 충족하는 열을 선택
◎ 날짜, 누락값이 있는 데이터 등 지저분한 데이터를 다루기
◎ 메서드 체이닝으로 파이썬 판다스 작업 생산성을 향상
◎ 시각화를 통해 통찰을 얻고 잠재적인 데이터 이슈를 식별
◎ 데이터의 변동을 파악하는 능력을 향상
◎ 사용자 정의 함수 및 클래스를 작성해 데이터 정제를 자동화
뒤로 앞으로 맨위로 공유하기