확장메뉴
주요메뉴


닫기
사이즈 비교
소득공제
파이썬으로 배우는 자연어 처리 인 액션

파이썬으로 배우는 자연어 처리 인 액션

제이펍-I♥A.I 시리즈이동
리뷰 총점9.4 리뷰 5건 | 판매지수 156
정가
35,000
판매가
31,500 (10% 할인)
신상품이 출시되면 알려드립니다. 시리즈 알림신청
분철서비스 시작 시 알려드립니다. 분철서비스 알림신청

품목정보

품목정보
발행일 2020년 03월 04일
쪽수, 무게, 크기 652쪽 | 188*245*32mm
ISBN13 9791190665018
ISBN10 1190665018

이 상품의 태그

비전공자도 이해할 수 있는 AI 지식

비전공자도 이해할 수 있는 AI 지식

17,820 (10%)

'비전공자도 이해할 수 있는 AI 지식' 상세페이지 이동

Clean Code 클린 코드

Clean Code 클린 코드

29,700 (10%)

'Clean Code 클린 코드' 상세페이지 이동

디자인, 이것만 알면 쉬워져요 with 63가지 LESSON

디자인, 이것만 알면 쉬워져요 with 63가지 LESSON

18,000 (10%)

'디자인, 이것만 알면 쉬워져요 with 63가지 LESSON' 상세페이지 이동

Do it! HTML+CSS+자바스크립트 웹 표준의 정석

Do it! HTML+CSS+자바스크립트 웹 표준의 정석

27,000 (10%)

'Do it! HTML+CSS+자바스크립트 웹 표준의 정석' 상세페이지 이동

챗GPT와 업무자동화

챗GPT와 업무자동화

16,200 (10%)

'챗GPT와 업무자동화' 상세페이지 이동

만들면서 배우는 파이썬과 40개의 작품들

만들면서 배우는 파이썬과 40개의 작품들

16,920 (10%)

'만들면서 배우는 파이썬과 40개의 작품들' 상세페이지 이동

Do it! 깡샘의 안드로이드 앱 프로그래밍 with 코틀린

Do it! 깡샘의 안드로이드 앱 프로그래밍 with 코틀린

36,000 (10%)

'Do it! 깡샘의 안드로이드 앱 프로그래밍 with 코틀린' 상세페이지 이동

혼자 공부하는 얄팍한 코딩 지식

혼자 공부하는 얄팍한 코딩 지식

16,200 (10%)

'혼자 공부하는 얄팍한 코딩 지식' 상세페이지 이동

얄코의 TOO MUCH 친절한 HTML+CSS+자바스크립트

얄코의 TOO MUCH 친절한 HTML+CSS+자바스크립트

28,800 (10%)

'얄코의 TOO MUCH 친절한 HTML+CSS+자바스크립트' 상세페이지 이동

그림으로 공부하는 IT 인프라 구조

그림으로 공부하는 IT 인프라 구조

23,400 (10%)

'그림으로 공부하는 IT 인프라 구조' 상세페이지 이동

모두의 딥러닝

모두의 딥러닝

21,600 (10%)

'모두의 딥러닝' 상세페이지 이동

프롬프트 엔지니어링

프롬프트 엔지니어링

22,500 (10%)

'프롬프트 엔지니어링' 상세페이지 이동

챗GPT와 기획·분석·보고

챗GPT와 기획·분석·보고

16,200 (10%)

'챗GPT와 기획·분석·보고' 상세페이지 이동

Do it! 깡샘의 플러터 & 다트 프로그래밍

Do it! 깡샘의 플러터 & 다트 프로그래밍

36,000 (10%)

'Do it! 깡샘의 플러터 & 다트 프로그래밍' 상세페이지 이동

이득우의 게임 수학

이득우의 게임 수학

40,500 (10%)

'이득우의 게임 수학' 상세페이지 이동

Do it! 쉽게 배우는 파이썬 데이터 분석

Do it! 쉽게 배우는 파이썬 데이터 분석

20,700 (10%)

'Do it! 쉽게 배우는 파이썬 데이터 분석' 상세페이지 이동

스테이블 디퓨전으로 만드는 게임 그래픽

스테이블 디퓨전으로 만드는 게임 그래픽

25,200 (10%)

'스테이블 디퓨전으로 만드는 게임 그래픽' 상세페이지 이동

Do it! 쉽게 배우는 R 데이터 분석

Do it! 쉽게 배우는 R 데이터 분석

18,000 (10%)

'Do it! 쉽게 배우는 R 데이터 분석' 상세페이지 이동

Node.js 교과서

Node.js 교과서

37,800 (10%)

'Node.js 교과서' 상세페이지 이동

파이브 라인스 오브 코드

파이브 라인스 오브 코드

25,200 (10%)

'파이브 라인스 오브 코드' 상세페이지 이동

책소개 책소개 보이기/감추기

목차 목차 보이기/감추기

저자 소개 (4명)

책 속으로 책속으로 보이기/감추기

단어의 이러한 벡터 표현과 문서의 테이블 표현이 가진 한 가지 장점은 그 어떤 정보도 소실되지 않는다는 점이다. 각 열이 어떤 단어에 대응되는지에 관한 정보만 유지한다면, 이러한 원핫 벡터들의 테이블로 원래의 문서를 복원할 수 있다. 그리고 이러한 복원 과정은 100% 정확하다. 비록 현재의 토큰 생성기가 우리가 유용하다고 생각하는 수준의 90%의 정확도로만 토큰들을 생성한다고 해도 그렇다. 이런 장점 때문에 신경망, 문장 대 문장 언어 모형, 생성적 언어 모형들에서는 이런 원핫 단어 벡터들을 흔히 사용한다. 원핫 벡터 표현은 원래의 텍스트에 담긴 의미를 고스란히 유지해야 하는 모든 종류의 모형이나 NLP 파이프라인에 적합하다.
--- p.45

간단한 검색 엔진들은 바로 이 TF-IDF 수치 하나에 기초한다. 이 수치를 통해 우리는 텍스트(문자열) 처리의 세계에서 수치 연산의 세계로 확실하게 넘어오게 되었다. 다음 절부터는 이 수치로 할 수 있는 계산들을 살펴본다. 사실 여러분이 TF-IDF 계산을 구현하는 코드를 실제로 작성할 일은 거의 없을 것이다. 선형대수를 몰라도 자연어 처리에 쓰이는 도구들을 이해하는 데 크게 문제가 되지는 않는다. 그러긴 하지만, 이런 공식들에 익숙해지면 자연어 처리 도구들을 좀 더 직관적으로 이해하고 사용할 수 있게 된다.
--- p.109

LDA 모형의 ‘훈련’에 필요한 것은 이진 부류의 두 무게중심을 잇는 직선을 찾는 것이다. 이번 예제의 분류기는 주어진 단문 문자(SMS) 메시지가 스팸인지 아닌지를 분류한다. 즉, 이진 부류는 ‘스팸’ 대 ‘비스팸’이다. LDA는 지도 학습에 속하므로, 훈련용 문자(SMS) 메시지들에 분류명(class label)을 붙여 두어야 한다. 이러한 모형으로 추론(inference) 또는 예측을 수행하는 방법은 간단하다. 그냥 TF-IDF 벡터가 어느 부류의 무게중심에 더 가까운지 보면 된다. 즉, 만일 TF-IDF 벡터가 스팸 부류 무게중심에 더 가깝다면 그 벡터에 해당하는 메시지는 스팸일 가능성이 크다.
--- p.130

이런 과대적합은 NLP의 고질적인 문제이다. 사람들의 다양한 어법과 어휘를 포함하며 응용 분야에 맞는 적절한 분류명이 붙은 자연어 자료 집합을 구하기란 쉽지 않다. 실제로 나는 스패머들이 고안할 만한 모든 스팸성 단어와 비스팸성 단어를 포함한 거대한 문자 메시지 데이터베이스를 구할 수 없었다. 그런 자료 집합을 만들어낼 수 있는 기업은 극히 소수이다. 따라서 우리가 할 수 있는 일은 과대적합을 기정사실로 받아들이고 그에 대한 대응책을 모색하는 것뿐이다. 즉, 적은 수의 훈련 견본으로 모형을 훈련해도 모형이 미지의 견본들에 잘 “일반화되게” 하는 알고리즘을 찾아야 한다.
--- p.153

합성곱 필터는 인접한 단어들에서 특정한 패턴을 검출한다. 그리고 단어들의 위치가 조금 변해도 합성곱 신경망의 출력은 크게 영향을 받지 않는다. 중요한 점은, 서로 가까이 있는 개념들이 합성곱 신경망에 큰 영향을 준다는 것이다. 그런데 좀 더 넓은 시야로 텍스트를 바라보고 좀 더 긴 시간 구간에서 단어들 사이의 관계들을 파악하고 싶다면, 그러니까 인접한 토큰 세 개나 네 개보다는 더 큰 구간으로 단어들을 처리하고 싶다면 어떻게 해야 할까? 그러니까 신경망이 “꽤 오래전에 본 단어들”을 고려하게 만들려면, 다시 말해 신경망에 ‘기억’ 능력을 추가하려면 어떻게 해야 할까?
--- p.293

추천평 추천평 보이기/감추기

NLP 시스템의 내부 작동 방식을 이해하는 것은 물론이고, 여러분 스스로 알고리즘과 모형을 만드는 데 필요한 이론과 실무 지식도 배운다.
- Dr. 아원 그리피온(Zendesk) (추천사에서)
요즘 쓰이는 파이썬 NLP 도구들을 잘 개괄한다. 나의 NLP 프로젝트마다 이 책을 끼고 다닐 생각이다. 강력하게 추천한다!
- 토니 멀런 (노스이스턴대학교(시애틀))
NLP를 처음 시작하는 사람들을 위한 직관적인 지침서! NLP를 대단히 실용적으로 배울 수 있는 프로그래밍 예제로 가득하다.
- 토마소 테오필리 (어도비(Adobe Systems))

회원리뷰 (3건) 회원리뷰 이동

한줄평 (2건) 한줄평 이동

총 평점 10.0점 10.0 / 10.0

배송/반품/교환 안내

배송 안내
반품/교환 안내에 대한 내용입니다.
배송 구분 예스24 배송
  •  배송비 : 무료배송
포장 안내

안전하고 정확한 포장을 위해 CCTV를 설치하여 운영하고 있습니다.

고객님께 배송되는 모든 상품을 CCTV로 녹화하고 있으며, 철저한 모니터링을 통해 작업 과정에 문제가 없도록 최선을 다 하겠습니다.

목적 : 안전한 포장 관리
촬영범위 : 박스 포장 작업

  • 포장안내1
  • 포장안내2
  • 포장안내3
  • 포장안내4
반품/교환 안내

상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내에 대한 내용입니다.
반품/교환 방법
  •  고객만족센터(1544-3800), 중고샵(1566-4295)
  •  판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  •  출고 완료 후 10일 이내의 주문 상품
  •  디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  •  중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용
  •  고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  •  직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음

    단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제

    •  오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소
    •  오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소
  •  직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음

    단, 당일 00시~13시 사이의 주문은 취소 수수료 면제

  •  박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  •  소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  •  소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  •  복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  •  소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  •  디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  •  eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  •  중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  •  LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등)
  •  시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  •  전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  •  상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에
따른 배상
  •  대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리
  •  쿠폰은 결제 시 적용해 주세요.
1   31,500
뒤로 앞으로 맨위로 공유하기