확장메뉴
주요메뉴


소득공제 PDF
미리보기 공유하기
eBook

잡아라! 텍스트 마이닝 with 파이썬

: 지금 바로 할 수 있는 데이터 추출과 분석

[ PDF ]
첫번째 리뷰어가 되어주세요 | 판매지수 498
정가
13,600
판매가
13,600(종이책 정가 대비 20% 할인)
YES포인트
추가혜택
쿠폰받기
구매 시 참고사항
{ Html.RenderPartial("Sections/BaseInfoSection/DeliveryInfo", Model); }
한 눈에 보는 YES24 단독 선출간
매월 1~7일 디지털머니 충전 시 보너스머니 2배 적립
[자기계발] 단독 선출간! 『감사의 재발견』
[경제경영] YES$MONEY
[경제경영] 단독 선출간! 『주식의 道(도)』
[자기계발] 계획을 세울 철이 돌아왔습니다!
[READ NOW] 2022년 1월호
eBook 전종 10%할인+5%적립 무한발급 슈퍼쿠폰
1월 전사
현대카드
1 2 3 4 5

품목정보

품목정보
출간일 2019년 04월 30일
이용안내 ?
  •  배송 없이 구매 후 바로 읽기
  •  이용기간 제한없음
  •  TTS 가능?
  •  저작권 보호를 위해 인쇄 기능 제공 안함
지원기기 크레마, PC(윈도우), 아이폰, 아이패드, 안드로이드폰, 안드로이드패드, 전자책단말기, PC(Mac)
파일/용량 PDF(DRM) | 11.95MB ?
ISBN13 9791190014311
KC인증

이 상품의 태그

소개 책소개 보이기/감추기

파이썬을 이용한 텍스트 마이닝으로
‘아’ 다르고 ‘어’ 다른 한글 텍스트 분석하기

알고리즘에 대한 수학적인 이해가 없어도 개념 파악을 도와주며 독자들이 코드를 따라하면서 결과를 바로바로 확인할 수 있도록 구성했다. 또한 텍스트 데이터 추출을 위해 필수적인 웹 크롤링 기술도 익힌다. 따라서 독자들은 어떠한 웹페이지라도 이 책의 내용을 응용하여 스스로 데이터를 추출 할 수 있다. 이 책을 본 이후에는 데이터 수집부터 분석까지 전 과정을 스스로 할 수 있다.

텍스트 마이닝 분야는 공학자들 이외에 인문, 사회, 예체능 학생들 및 기업에서도 논문, 마케팅을 위해 쓸 수 있다. 세상 속에 존재하는 전체 데이터의 90% 이상이 비정형 텍스트 데이터로 이루어져 있다. 특히 각종 웹 페이지, sns 등에서 엄청난 양의 비정형 텍스트 데이터가 쏟아져 나오고 있다. 이러한 비정형 텍스트 데이터를 잘 활용한다면 연구, 기업 경영 전략에 매우 유익하게 활용될 수 있으며 이를 위해서는 텍스트 마이닝 기술이 필수적이다.

이 책의 특징
- 입문자를 위한 기초 수준의 파이썬 기본 문법들을 소개한다.
- 파이썬을 이용한 텍스트 마이닝 방법들의 예제를 소개한다.
- 텍스트 마이닝과 함께 사용할 웹 크롤링 기법을 소개한다.

이 책이 필요한 독자
- 텍스트 마이닝을 이용하여 논문을 쓰려는 분
- 웹에서 발생하는 텍스트 정보를 활용하여 기업 마케팅 및 인사이트 도출을 원하는 분
- 텍스트 마이닝을 공부하고 싶은 분

소스코드 다운로드
https://github.com/bjpublic/tmwithpython

목차 목차 보이기/감추기

1. 텍스트 마이닝이란?
1.1. 문서 수집
1.2. 문서 특징

2. 데이터 사전 처리를 위한 기초 파이썬 코딩
2.1. 아나콘다 설치
2.2. 주피터 노트북
2.3. pandas 라이브러리
2.4. numpy 라이브러리

3.텍스트 데이터
3.1. 정규 표현식
3.2. 사전 처리
3.3. 품사 분석

4. 텍스트 마이닝 기법
4.1. 단어 빈도분석 - 기본적인 통계정보를 알아보자!
4.2. 군집 분석 - 유사한 문서들을 모아보자!
4.3. 토픽 모델링 - 토픽 모델링을 이용하여 문서의 토픽을 추론하자!
4.4. 감성 분석 - 텍스트의 감성 정도를 지표로 나타내자!
4.5. 연관어 분석

5. 텍스트 크롤링
5.1. Beautifulsoup을 이용한 크롤링
5.2. 셀레니움을 이용한 크롤링
5.3. lxml을 이용한 크롤링

6. 실전: 트위터 메시지 분석

7. 실전: 소셜커머스 후기 분석

저자 소개 (1명)

출판사 리뷰 출판사 리뷰 보이기/감추기

우리는 데이터의 홍수 속에서 살아가고 있지만 넘치는 데이터를 전부 받아들이고 분석을 할 수 없을 것이다. 데이터를 분석하기 위해서 그만큼 엄청난 인건비와 시간이 소요되기 때문이다. 데이터의 종류는 많지만, 우리가 가장 많이 보고 접하는 데이터는 역시 텍스트 데이터이다. 따라서 텍스트 데이터 분석이 가장 필요할 것이다.

이 책은 공학도가 아닌 독자에게도 유용할 것이다.?가장 인기 있는 프로그래밍 언어 중 하나인 파이썬을 이용해 텍스트 데이터 수집을 위한 크롤링을 넘어 분석까지 스스로 할 수 있도록 도와주면서 파이썬과 텍스트 마이닝의 기초를 배우게 될 것이다.
뒤로 앞으로 맨위로 aniAlarm