확장메뉴
주요메뉴


소득공제
미리보기 공유하기

잡아라! 텍스트 마이닝 with 파이썬

: 지금 바로 할 수 있는 데이터 추출과 분석

리뷰 총점9.0 리뷰 6건 | 판매지수 1,389
베스트
IT 모바일 top100 1주
정가
17,000
판매가
15,300 (10% 할인)
YES포인트
소중한 당신에게 5월의 선물 - 산리오 3단 우산/디즈니 우산 파우치/간식 접시 머그/하트 이중 머그컵
월간 개발자 2022년 5월호
내일은 개발자! 코딩테스트 대비 도서전
5월 전사
5월 쇼핑혜택
1 2 3 4 5

품목정보

품목정보
출간일 2019년 04월 30일
쪽수, 무게, 크기 204쪽 | 370g | 173*230*12mm
ISBN13 9791186697788
ISBN10 1186697784

이 상품의 태그

책소개 책소개 보이기/감추기

파이썬을 이용한 텍스트 마이닝으로
‘아’ 다르고 ‘어’ 다른 한글 텍스트 분석하기

알고리즘에 대한 수학적인 이해가 없어도 개념 파악을 도와주며 독자들이 코드를 따라하면서 결과를 바로바로 확인할 수 있도록 구성했다. 또한 텍스트 데이터 추출을 위해 필수적인 웹 크롤링 기술도 익힌다. 따라서 독자들은 어떠한 웹페이지라도 이 책의 내용을 응용하여 스스로 데이터를 추출 할 수 있다. 이 책을 본 이후에는 데이터 수집부터 분석까지 전 과정을 스스로 할 수 있다.

텍스트 마이닝 분야는 공학자들 이외에 인문, 사회, 예체능 학생들 및 기업에서도 논문, 마케팅을 위해 쓸 수 있다. 세상 속에 존재하는 전체 데이터의 90% 이상이 비정형 텍스트 데이터로 이루어져 있다. 특히 각종 웹 페이지, sns 등에서 엄청난 양의 비정형 텍스트 데이터가 쏟아져 나오고 있다. 이러한 비정형 텍스트 데이터를 잘 활용한다면 연구, 기업 경영 전략에 매우 유익하게 활용될 수 있으며 이를 위해서는 텍스트 마이닝 기술이 필수적이다.

목차 목차 보이기/감추기

1. 텍스트 마이닝이란?
1.1. 문서 수집
1.2. 문서 특징

2. 데이터 사전 처리를 위한 기초 파이썬 코딩
2.1. 아나콘다 설치
2.2. 주피터 노트북
2.3. pandas 라이브러리
2.4. numpy 라이브러리

3.텍스트 데이터
3.1. 정규 표현식
3.2. 사전 처리
3.3. 품사 분석

4. 텍스트 마이닝 기법
4.1. 단어 빈도분석 - 기본적인 통계정보를 알아보자!
4.2. 군집 분석 - 유사한 문서들을 모아보자!
4.3. 토픽 모델링 - 토픽 모델링을 이용하여 문서의 토픽을 추론하자!
4.4. 감성 분석 - 텍스트의 감성 정도를 지표로 나타내자!
4.5. 연관어 분석

5. 텍스트 크롤링
5.1. Beautifulsoup을 이용한 크롤링
5.2. 셀레니움을 이용한 크롤링
5.3. lxml을 이용한 크롤링

6. 실전: 트위터 메시지 분석

7. 실전: 소셜커머스 후기 분석

저자 소개 (1명)

만든이 코멘트 만든이 코멘트 보이기/감추기

안녕하세요. 이책의 편집자 입니다.
2019-05-22
안녕하세요, 비제이퍼블릭입니다. 독자분들이 문의주셨던 본문에 기재된 소스 코드 파일들이 깃허브에 업데이트 되었습니다. 늦은 업데이트로 인해 불편을 드려 죄송하며, 앞으로도 많은 관심 부탁드립니다. 감사합니다.

출판사 리뷰 출판사 리뷰 보이기/감추기

이 책의 특징
- 입문자를 위한 기초 수준의 파이썬 기본 문법들을 소개한다.
- 파이썬을 이용한 텍스트 마이닝 방법들의 예제를 소개한다.
- 텍스트 마이닝과 함께 사용할 웹 크롤링 기법을 소개한다.

이 책이 필요한 독자
- 텍스트 마이닝을 이용하여 논문을 쓰려는 분
- 웹에서 발생하는 텍스트 정보를 활용하여 기업 마케팅 및 인사이트 도출을 원하는 분
- 텍스트 마이닝을 공부하고 싶은 분

소스코드 다운로드
https://github.com/bjpublic/tmwithpython

우리는 데이터의 홍수 속에서 살아가고 있지만 넘치는 데이터를 전부 받아들이고 분석을 할 수 없을 것이다. 데이터를 분석하기 위해서 그만큼 엄청난 인건비와 시간이 소요되기 때문이다. 데이터의 종류는 많지만, 우리가 가장 많이 보고 접하는 데이터는 역시 텍스트 데이터이다. 따라서 텍스트 데이터 분석이 가장 필요할 것이다..

이 책은 공학도가 아닌 독자에게도 유용할 것이다.?가장 인기 있는 프로그래밍 언어 중 하나인 파이썬을 이용해 텍스트 데이터 수집을 위한 크롤링을 넘어 분석까지 스스로 할 수 있도록 도와주면서 파이썬과 텍스트 마이닝의 기초를 배우게 될? 것이다.

회원리뷰 (6건) 리뷰 총점9.0

혜택 및 유의사항?
구매 포토리뷰 잡아라! 텍스트 마이닝 with 파이썬 내용 평점5점   편집/디자인 평점4점 YES마니아 : 로얄 진***학 | 2021.10.04 | 추천0 | 댓글0 리뷰제목
텍스트 데이터 분석 및 특정 텍스트 추출이 필요해 적합한 도서를 찾다가 구매한 도서다. 주피터 노트북의 설치와 pandas, numpy 모듈 등의 설치 방법에 대해 친절하게 사진으로 설명하고 다양한 텍스트 분석 방법을 설명한다. 특정 텍스트 추출에 있어서는 정규 표현식이 무척 중요하다. 여러 권의 책을 통해 공부 했었지만 매번 어렵게 느껴진다. 본서는 다양;
리뷰제목


텍스트 데이터 분석 및 특정 텍스트 추출이 필요해 적합한 도서를 찾다가 구매한 도서다.

주피터 노트북의 설치와 pandas, numpy 모듈 등의 설치 방법에 대해 친절하게 사진으로 설명하고 다양한 텍스트 분석 방법을 설명한다.


특정 텍스트 추출에 있어서는 정규 표현식이 무척 중요하다. 여러 권의 책을 통해 공부 했었지만 매번 어렵게 느껴진다. 본서는 다양한 예제를 통해 차근차근 이해하기 쉽게 설명하고 있어 도움이 된다. 
단어의 빈도를 이용해 단어구름(wordcloud) 형태로 표현하는 방법도 상세히 설명하고 있어 텍스트 분석에 관심 있는 분들에게 많은 도움이 될 것 이다. 

 

댓글 0 이 리뷰가 도움이 되었나요? 공감 0
구매 파이썬으로 텍스트 마이닝 해보고 싶으신 분들 추천 내용 평점5점   편집/디자인 평점4점 혜* | 2019.06.09 | 추천0 | 댓글0 리뷰제목
꽤나 많이들 배우는 분야인데에 반해서, 텍스트 마이닝 관련한 교재가 많이 없습니다. 그 중에서도 파이썬을 이용한 책은 더 없고요. 이 책은 파이썬으로 텍스트 마이닝 하는 방법을 소개한다는 것만으로도 충분히 구매의 가치가 있었습니다. 전체적으로 자주 쓰이는 부분들을 알려준다는 점이 만족스러웠고요, 파이썬 쌩기초 문법을 공부하신 후에 보면 더 좋을 것 같습니다. ;
리뷰제목

꽤나 많이들 배우는 분야인데에 반해서, 텍스트 마이닝 관련한 교재가 많이 없습니다. 그 중에서도 파이썬을 이용한 책은 더 없고요. 이 책은 파이썬으로 텍스트 마이닝 하는 방법을 소개한다는 것만으로도 충분히 구매의 가치가 있었습니다. 전체적으로 자주 쓰이는 부분들을 알려준다는 점이 만족스러웠고요, 파이썬 쌩기초 문법을 공부하신 후에 보면 더 좋을 것 같습니다. 

댓글 0 이 리뷰가 도움이 되었나요? 공감 0
어깨에 힘 뺀 텍스트 마이닝 체험 내용 평점3점   편집/디자인 평점3점 h********y | 2019.06.03 | 추천1 | 댓글0 리뷰제목
"텍스트 마이닝"이란 무엇이고 전체적으로 어떤 일을 어떻게 하는 지를 알아보기 위한 책이다. 작은 도서 판형에 200페이지 정도 되는 두께와 최소한의 편집, 그리고 인터넷 할인가 1.5만원이라는 가격대 역시 이 목적에 부합한다. 내용을 살펴보면, 매우 상세하고 친절해 보이는 목차와는 달리, 본문은 전개가 상당히 빠르다. 대학교 강의자료와 비슷한 느낌이다. 1장에서는;
리뷰제목


"텍스트 마이닝"이란 무엇이고 전체적으로 어떤 일을 어떻게 하는 지를 알아보기 위한 책이다. 작은 도서 판형에 200페이지 정도 되는 두께와 최소한의 편집, 그리고 인터넷 할인가 1.5만원이라는 가격대 역시 이 목적에 부합한다. 


내용을 살펴보면, 매우 상세하고 친절해 보이는 목차와는 달리, 본문은 전개가 상당히 빠르다. 대학교 강의자료와 비슷한 느낌이다. 


1장에서는 텍스트 마이닝이 무엇을 하는 것인지 간략하게 정의한다. 


2장은 파이썬 설치 및 pandas, numpy 라이브러리에 대한 기초 설명이 나온다. 정말 간단하다. 다 합쳐서 20페이지다. 


3장은 텍스트 데이터를 정리하는 방법이다. 즉 정규 표현식, 사전 처리, 품사 분석 등을 알려준다. 핵심만 나와있는 부분이 오히려 좋았다. 


4장에서는 텍스트 마이닝을 직접 수행해본다. 빈도 분석, 군집 분석, 토픽 모델링, 감성 분석, 연관어 분석 등을 맛볼 수 있다. 약 100페이지 정도인데 소스코드에 대한 설명이 상세하지는 않다. "17~19줄까지는 감성사전을 이용하는 내용이다."와 같은 식이다. 파이썬 기초, 혹은 최소한 다른 프로그래밍 언어를 하나라도 아는 사람만 무리 없이 이해할 수 있을 것 같다. 2~3장에 소개된 대부분의 파이썬 기초 및 관련 라이브러리 활용법을 독자가 대충이라도 미리 알고 있어야 한다는 이야기다. 


5장~6장은 실전 예제로 트위터와 소셜커머스 후기를 수집해서 앞에서 배운 텍스트 마이닝 기법을 적용해본다. 


개인적으로는 파이썬을 어느 정도 알면서 텍스트 마이닝이란 분야가 궁금했었기에 상당히 재미있게 읽었다. 설명과 내용에 군더더기가 없고 책이 가벼워서 부담이 없었다. 


예제 데이터와 코드도 깃헙에서 다운 받아서 실행해볼 수 있었다.  장별로  예제파일 정리도 안 되어있고, 소스도 좀 미묘한 상태라 이런 저런 수정을 해야 했지만 말이다. 


위와 같은 이유로 이 책은 파이썬과 데이터 과학 관련 라이브러리에 친숙하지 않은 초보자들이 도전하기에는 쉽지 않을 것으로 예상된다. 그렇지만 파이썬 유저이면서 가볍게 텍스트 마이닝을 접해보고 싶은 사람들에게는 추천할만한 도서이다. 



댓글 0 1명이 이 리뷰를 추천합니다. 공감 1

한줄평 (6건) 한줄평 총점 6.4

혜택 및 유의사항 ?
구매 평점5점
텍스트에서 특정 단어들을 추출하는 방법을 알기 위해 구매했는데 친절하게 설명되어 있네요.
이 한줄평이 도움이 되었나요? 공감 0
YES마니아 : 로얄 진***학 | 2021.10.04
구매 평점2점
설명이 너무 부실합니다 ㅠㅠ 텍스트 마이닝이 의외로 쓸만한 관련 서적이 적네요
1명이 이 한줄평을 추천합니다. 공감 1
뤼* | 2019.11.12
평점1점
이미 텍-마 할 줄 아는 사람만 이해할 것 같은데, 그렇기엔 또 쉽고. 컨셉을 모르겠습니다
1명이 이 한줄평을 추천합니다. 공감 1
얼**자 | 2019.11.05
  •  쿠폰은 결제 시 적용해 주세요.
1   15,300
뒤로 앞으로 맨위로 aniAlarm