이미지 검색을 사용해 보세요
검색창 이전화면 이전화면
최근 검색어
인기 검색어

소득공제 크레마클럽 PDF
eBook Do it! 쉽게 배우는 R 텍스트 마이닝
단어 빈도 분석, 감정 분석, 의미망 분석부터 토핑 모델링까지 현장에서 사용하는 텍스트 분석 기법을 실전 예제로 익혀 보자! 스마트한 PDF 필기 기능을 사용해 보세요!
가격
13,000
13,000
YES포인트?
650원 (5%)
5만원 이상 구매 시 2천원 추가 적립
결제혜택
카드/간편결제 혜택을 확인하세요
PDF 안내

이 상품은 구매 후 지원 기기에서 예스24 eBook앱 설치 후 바로 이용 가능한 상품입니다.

예스24만의 독보적인 PDF 필기 기능을 경험해 보세요!

이 상품의 태그

상세 이미지

소개

목차

__1장 단어 빈도 분석: 무엇을 강조했을까?
_01-1 텍스트 전처리
_01-2 토큰화하기
_01-3 단어 빈도 분석하기

__2장 형태소 분석기를 이용한 단어 빈도 분석
_02-1 형태소 분석
_02-2 명사 빈도 분석하기
_02-3 특정 단어가 사용된 문장 살펴보기

__3장 비교 분석: 무엇이 다를까?
_03-1 단어 빈도 비교하기
_03-2 오즈비 — 상대적으로 중요한 단어 비교하기
_03-3 로그 오즈비로 단어 비교하기
_03-4 TF-IDF — 여러 텍스트의 단어 비교하기

__4장 감정 분석: 어떤 마음으로 글을 썼을까?
_04-1 감정 사전 활용하기
_04-2 댓글 감정 분석하기
_04-3 감정 범주별 주요 단어 살펴보기
_04-4 감정 사전 수정하기

__5장 의미망 분석: 어떤 맥락에서 단어를 썼을까?
_05-1 동시 출현 단어 분석 — Co-occurrence analysis
_05-2 동시 출현 네트워크 — Co-occurrence network
_05-3 단어 간 상관 분석 — Phi coefficient
_05-4 연이어 사용된 단어쌍 분석 — n-gram

__6장 토픽 모델링: 어떤 주제로 글을 썼을까?
_06-1 토픽 모델링 개념 알아보기
_06-2 LDA 모델 만들기
_06-3 토픽별 주요 단어 살펴보기
_06-4 문서를 토픽별로 분류하기
_06-5 토픽 이름 짓기
_06-6 최적의 토픽 수 정하기

__7장 텍스트 마이닝 프로젝트: 타다 금지법 기사 댓글 분석
_07-1 주요 단어 살펴보기
_07-2 공감, 비공감 댓글 비교하기
_07-3 관심 댓글 비교하기
_07-4 단어 간 관계 살펴보기
_07-5 토픽 모델링

__8장 텍스트 마이닝 프로젝트: 차기 대선 주자 SNS 여론 분석
_08-1 SNS 언급량 추이 살펴보기
_08-2 SNS 이슈 살펴보기
_08-3 감정 단어 살펴보기
_08-4 감정 경향 살펴보기
_08-5 감정 추이 살펴보기
_08-6 긍정, 부정 트윗 단어 비교하기

__9장 텍스트를 효율적으로 분석하는 방법
_09-1 텍스트 데이터 수집하기
_09-2 텍스트 분석 품질 높이기
_09-3 완전 유용한 꿀팁

저자 소개1

데이터로 세상을 이해하는 일을 하는 데이터 분석가이다. 기업, 대학, 연구 기관, 시민 단체 등 다양한 조직의 데이터 분석 프로젝트를 진행하고 있다. 측정, 실험, 데이터를 좋아하고, 혈액형 성격론, 타로 카드, 자기계발서를 싫어한다. 데이터에 기반을 둔 대화를 추구하므로 지인들로부터 신뢰할 만하다는 평을 듣지만 친구는 별로 없다. 현재 초보자도 어깨춤을 추며 데이터를 분석하게 만드는 강의를 진행하고 있으며, SKT, KT, 삼성금융연수원, LG인화원, 멀티캠퍼스, 패스트캠퍼스 등에서 강의했다. 데이터 관련 분야의 다양한 소식과 실무 노하우를 전하는 유튜브 채널 ‘데이터홀릭’을
데이터로 세상을 이해하는 일을 하는 데이터 분석가이다. 기업, 대학, 연구 기관, 시민 단체 등 다양한 조직의 데이터 분석 프로젝트를 진행하고 있다. 측정, 실험, 데이터를 좋아하고, 혈액형 성격론, 타로 카드, 자기계발서를 싫어한다. 데이터에 기반을 둔 대화를 추구하므로 지인들로부터 신뢰할 만하다는 평을 듣지만 친구는 별로 없다. 현재 초보자도 어깨춤을 추며 데이터를 분석하게 만드는 강의를 진행하고 있으며, SKT, KT, 삼성금융연수원, LG인화원, 멀티캠퍼스, 패스트캠퍼스 등에서 강의했다. 데이터 관련 분야의 다양한 소식과 실무 노하우를 전하는 유튜브 채널 ‘데이터홀릭’을 운영하고 있다. 레어템을 좋아하는 여인에게 수집돼 함께 살고 있으며, 가장 효율적으로 아무것도 안 하는 고양이 두 마리를 모시고 있다.

김영우의 다른 상품

관련 분류

카테고리 분류

품목정보

발행일
2021년 02월 15일
이용안내
  •  배송 없이 구매 후 바로 읽기
  •  이용기간 제한없음
  •   TTS 가능 ?
  •  저작권 보호를 위해 인쇄 기능 제공 안함
지원기기
크레마, PC(윈도우 - 4K 모니터 미지원), 아이폰, 아이패드, 안드로이드폰, 안드로이드패드, 전자책단말기(저사양 기기 사용 불가), PC(Mac)
파일/용량
PDF(DRM) | 29.99MB ?
글자 수/ 페이지 수
약 345쪽 ?
ISBN13
9791163032328

출판사 리뷰

R을 배웠는데 어떻게 써먹어야 할지 모르는 사람 모두 모여라!
실전에 주제별로 응용할 수 있는 학습·실습 구성으로 알차다!

텍스트 마이닝을 진짜 내가 할 수 있을까? 이 책과 함께라면 당연히 할 수 있다! 저자는 R에 입문한 사람이라면 누구나 따라 할 수 있는 구성으로 ‘완벽한 텍스트 마이닝 실습 매뉴얼’을 준비했다. 이 책은 텍스트 마이닝 실전 연습을 충분히 할 수 있도록 현재 우리 사회에서 이슈가 되고 있는 4가지 주제를 중심으로 데이터를 엄선하여 텍스트 마이닝 실습을 진행한다. ‘대통령 연설문’, ‘영화 <기생충> 오스카상 수상 댓글’, ‘타다 금지법 댓글’, ‘내년 대선 후보 댓글’의 4가지 실제 사례를 분석하며 개념을 이해하는 과정으로 구성해서 처음에는 복잡해 보이는 개념도 실습을 진행하다 보면 술술 이해될 것이다.

정말로, 진짜로, 어디까지 내 손으로 할 수 있을까?
형태소 분석부터 단어 분석, 감정 분석 등 ‘고급 데이터 분석 과정’ 모두 수록!

이제는 데이터 분석 기초 능력만 향상할 것이 아니라 실제 사례를 분석할 줄 아는 능력을 키워야 하는 시대가 되었다. 개발자, 마케터, 프로젝트 관리자 등 모두가 알아야 할 기초 소양이 된 것이다. 이 책은 문장을 구성하는 명사, 동사, 형용사 등과 같은 품사를 분류하는 작업인 형태소 분석부터 상대적으로 중요한 단어를 짚어 주는 ‘오즈비’, ‘로그 오즈비’ 활용, 감정 사전을 활용한 문장의 감정 분석, 동시 출현 네트워크를 활용한 단어 맥락 분석, 단어가 사용된 문단의 주제를 찾아 주는 ‘토픽 모델링’까지! ‘텍스트 데이터 분석 고급 과정’을 직접 해낸 사람으로 만들어 준다. 게다가 텍스트 데이터 분석이 편해지는 ‘꿀팁’부터 코드를 실행하다 함정에 빠지기 쉬운 부분까지 짚어 주니 그야말로 ‘텍스트 마이닝 꿀단지’이다.

내일 ‘사용자 선호도 분석’ 보고서를 제출해야 하는데 어떻게 하지?
보고서, 기사, 프레젠테이션에 바로 사용해도 손색없는 결과물을 이 책으로 만들어 보자!

저자는 “이 책을 집필할 때 바로 실무에 사용해도 될 수준의 텍스트 분석 과정과 시각화 과정을 포함하기 위해 노력했다.”고 강조한다. 현장에서 일하고 강의하면서 만난 후배와 수강자가 꼽은 국내 텍스트 마이닝 학습 콘텐츠의 가장 아쉬운 점이 ‘학습과 실제 업무의 괴리가 크다’였기 때문이다. 이 책은 그런 지점을 완벽하게 해소하고 있다. 한글 데이터를 다루는 텍스트 분석 과정은 실무에 가까운 수준이고, 분석 결과로 만드는 시각화 자료는 내일 당장 보고서, 신문 기사, 프레젠테이션 등에 사용해도 손색없는 수준이다.

저자는 당신이 어디에서 어떻게 어려워할지 다 알고 있다!
저자가 옆에 앉아 친절하게 설명해 주는 문장으로 감동받으며 공부하자!

텍스트 분석 과정은 가시밭길이다. 어디에서 어떤 문제가 벌어질지 모르기 때문이다. 하지만 저자는 이런 과정을 학습자•강의자 입장에서 모두 겪어 본 베테랑 중의 베테랑이다. 본문을 읽다 보면 저자가 옆에 앉아서 “여기는 아마 헷갈릴 텐데 이렇게 하면 쉽게 이해할 수 있을 겁니다.”라고 말해 주는 느낌을 받을 것이다. 또한 본문을 읽다가 궁금해할 만한 내용이나, 지금 당장 몰라도 되지만 결국은 알아야 할 내용은 본문 중간중간에 ‘꿀팁’, ‘알아두면 좋아요’로 풍부하게 배치했다.

리뷰/한줄평10

리뷰

10.0 리뷰 총점

한줄평

8.0 한줄평 총점

클린봇이 부적절한 글을 감지 중입니다.

설정