카트

이미지 검색을 사용해 보세요

검색창 이전화면 이전화면

최근 검색어: 전체삭제

인기 검색어

닫기

미리보기 공유하기

소득공제 PDF

eBook 자연어 처리를 위한 허깅페이스 트랜스포머 하드 트레이닝

코드와 결과물로 이해하는 언어 모델과 트랜스포머 스마트한 PDF 필기 기능을 사용해 보세요!

박성환,남승우 저

비제이퍼블릭(BJ퍼블릭) 2025.01.13.

리뷰 총점 9.9 회원리뷰 30 판매지수 318

가격: 22,000원

19,800 22,000 쿠폰혜택가

YES포인트?: 1,100원 (5%)

5만원 이상 구매 시 2천원 추가 적립

사용 가능한 쿠폰 받기

앱 다운 시 1천원 상품권

결제혜택: 카드/간편결제 혜택을 확인하세요

PDF 안내

이 상품은 구매 후 지원 기기에서 예스24 eBook앱 설치 후 바로 이용 가능한 상품입니다.

예스24만의 독보적인 PDF 필기 기능을 경험해 보세요!

이 분야의 이벤트

시리즈 태그 업체 공지사항 구성 소개 특별 구성 MD 한마디 카드뉴스 상세 이미지 소개 관련 동영상 목차 미리듣기 저자 소개 관련분류 품목정보 만든이 코멘트 예스24 리뷰 책 속으로 줄거리 캐스팅 관련 자료 부가 영상 출판사 리뷰 전문가 리뷰 추천평

펼치기/닫기

이 상품의 태그

#알고리즘 #컴퓨터언어 #개발자언어 #케라스 #텐서플로 #파이썬 #딥러닝 #머신러닝 #생성형AI #인공지능 #자연어처리

eBook

자연어 처리를 위한 허깅페이스 트랜스포머 하드 트레이닝

22,000원

상품명 이동
eBook

게임 AI를 위한 탐색 알고리즘 입문

21,600원

상품명 이동
eBook

퍼즐로 이해하는 알고리즘

17,760원

상품명 이동
eBook

이것이 자료구조+알고리즘이다 with C 언어

27,200원

상품명 이동
eBook

IT 5분 잡학사전

10% 9,000원

상품명 이동
eBook

트랜스포머를 활용한 자연어 처리

31,200원

상품명 이동
eBook

인공지능 투자가 퀀트

11,200원

상품명 이동
eBook

AI, 빅테크, 저널리즘

14,080원

상품명 이동
eBook

파이썬으로 구현하는 로보어드바이저

28,800원

상품명 이동
eBook

줄리아 프로그래밍

27,200원

상품명 이동
eBook

데이터 분석으로 배우는 파이썬 문제 해결

21,200원

상품명 이동
eBook

안녕, 트랜스포머

19,200원

상품명 이동
eBook

파이썬으로 익히는 말랑말랑 알고리즘

24,000원

상품명 이동
eBook

파이썬으로 완성하는 비지도 학습 알고리즘

27,200원

상품명 이동
eBook

파이썬으로 캐글 뽀개기

24,800원

상품명 이동
eBook

자료구조와 알고리즘을 함께 Java!

20,000원

상품명 이동
eBook

디자인 씽킹을 넘어 프로그래밍 씽킹으로

10,000원

상품명 이동
eBook

분산원장 기술

17,600원

상품명 이동
eBook

송쌤의 스크래치 코딩 학교

12,600원

상품명 이동
eBook

나의 첫 파이썬 (2판)

24,000원

상품명 이동
더보기

상세 이미지

상세 이미지 더보기펼치기

소개

소개 더보기펼치기

1 자연어 처리와 허깅페이스

_1.1 허깅페이스 소개
__1.1.1 Datasets
__1.1.2 Models
__1.1.3 Spaces
__1.1.4 Docs
_1.2 자연어 처리와 허깅페이스의 관계

2 환경 구축

_2.1 구글 코랩 환경 구축
__2.1.1 계정 생성
__2.1.2 새 노트북 만들기
__2.1.3 코드 실행
__2.1.4 파일 저장
__2.1.5 깃 코드 열기
_2.2 구글 드라이브 마운트

3 허깅페이스 주요 라이브러리

_3.1 Datasets 라이브러리
__3.1.1 Datasets 설치
__3.1.2 Datasets 실습
_3.2 Transformers 라이브러리
__3.2.1 Transformers 설치
__3.2.2 Tokenizer
__3.2.3 DataCollator
__3.2.4 Model
__3.2.5 AutoClass
__3.2.6 Trainer, TrainingArguments
__3.2.7 Pipeline
_3.3 미세조정
__3.3.1 토크나이저와 모델 준비
__3.3.2 데이터 준비 및 전처리
__3.3.3 학습 파라미터 선정
__3.3.4 학습 진행
__3.3.5 성능 평가
__3.3.6 모델 저장
_3.4 허깅페이스 허브 등록
__3.4.1 push_to_hub()
__3.4.2 CLI
__3.4.3 huggingface-hub

4 보조 라이브러리

_4.1 Tokenizers 라이브러리
__4.1.1 Tokenizer 학습
__4.1.2 모델 초기화 후 학습
_4.2 Evaluate 라이브러리
__4.2.1 Evaluate 평가
__4.2.2 커스텀 메트릭 만들기
__4.2.3 Trainer 적용

5 언어 모델 구조 및 학습

_5.1 트랜스포머 모델
_5.2 인코더 기반 모델
__5.2.1 기본 구조
__5.2.2 Sequence Classification
__5.2.3 Multiple Choice
__5.2.4 Token Classification
__5.2.5 Question Answering
_5.3 디코더 기반 모델
__5.3.1 기본 구조
__5.3.2 Causal LM
__5.3.3 Question Answering
__5.3.4 Sequence Classification
_5.4 인코더-디코더 기반 모델
__5.4.1 기본 구조
__5.4.2 Conditional Generation
__5.4.3 Sequence Classification
__5.4.4 Question Answering

6 모델 활용

_6.1 모델 미세조정
__6.1.1 인코더 - Sequence Classification
__6.1.2 디코더 - Causal LM
__6.1.3 인코더-디코더 - Conditional Generation
__6.1.4 언어 모델 문장 생성
_6.2 모델 서빙

7 모델 경량화

_7.1 모델 경량화 개요
_7.2 PEFT
_7.3 양자화
_7.4 QLoRA 미세조정

8 TRL

_8.1 TRL 라이브러리 개요
_8.2 RLHF
_8.3 보상 모델 트레이닝
_8.4 SFT
_8.5 PPO
_8.6 Best-of-N 샘플링
_8.7 DPO
_8.8 KTO
_8.9 CPO
_8.10 ORPO

목차 더보기펼치기

저자 소개 2

저박성환

관심작가 알림신청

통계학을 전공하였으며 DB 관리 및 솔루션 개발 3년 9개월, 스타트업 자연어 처리(Natural Language Processing, NLP) 개발 2년 8개월 경력을 쌓은 후 현재는 국내 식품 관련 기업 풀무원의 Data&AI 팀에서 대규모 언어 모델(Large Language Model, LLM)을 활용한 HR 어시스턴트, AICC 콜봇 개발을 하고 있다. 최근에는 자연어 처리 관련 모델과 LLM에 관해 주로 공부 중이며 항상 아는 지식을 공유하고 모르는 지식은 배우려는 자세로 임하고 있다. 現) 풀무원 Data&AI 팀 NLP 개발. 前) AI 관련 스타트업 NLP 개

펼쳐보기더보기

통계학을 전공하였으며 DB 관리 및 솔루션 개발 3년 9개월, 스타트업 자연어 처리(Natural Language Processing, NLP) 개발 2년 8개월 경력을 쌓은 후 현재는 국내 식품 관련 기업 풀무원의 Data&AI 팀에서 대규모 언어 모델(Large Language Model, LLM)을 활용한 HR 어시스턴트, AICC 콜봇 개발을 하고 있다. 최근에는 자연어 처리 관련 모델과 LLM에 관해 주로 공부 중이며 항상 아는 지식을 공유하고 모르는 지식은 배우려는 자세로 임하고 있다.
現) 풀무원 Data&AI 팀 NLP 개발.
前) AI 관련 스타트업 NLP 개발, 퓨쳐누리 DB 관리 및 솔루션 개발.

저남승우

관심작가 알림신청

소프트웨어마이스터고등학교 소프트웨어개발과를 졸업했다. 2020년도에 디스코드 챗봇 개발 팀 ‘팀 크레센도’에서 활동하며 여러 챗봇 개발에 기여했고, 졸업 직후 취업해 5년 차 NLP 엔지니어로 재직 중이며 한국방송통신대학교 통계ㆍ데이터과학과 이수를 병행하고 있다. 현재는 sLM 사전학습, 프롬프트 엔지니어링 등의 자연어 처리 기술과 더불어 음성 인식 및 음성 합성에도 많은 관심을 가지고 공부하고 있다. 現) AI 관련 스타트업 NLP 개발. 前) 디스코드 챗봇 개발팀 ‘팀 크레센도’ 활동.

품목정보

발행일: 2025년 01월 13일

이용안내

배송 없이 구매 후 바로 읽기
이용기간 제한없음
TTS 가능 ?
저작권 보호를 위해 인쇄 기능 제공 안함

지원기기: 크레마, PC(윈도우 - 4K 모니터 미지원), 아이폰, 아이패드, 안드로이드폰, 안드로이드패드, 전자책단말기(저사양 기기 사용 불가), PC(Mac)

파일/용량: PDF(DRM) | 11.86MB ?

글자 수/ 페이지 수: 약 318쪽 ?

ISBN13: 9791165923174

출판사 리뷰

추론 속도를 높이고 성능을 발전시키는
허깅페이스 라이브러리 하드 트레이닝

1장에서는 허깅페이스 허브에 등록된 모델 및 데이터셋을 확인해보고 자연어 처리와 허깅페이스의 관계에 대해 알아봅니다.

2장에서는 허깅페이스를 하드 트레이닝해보기에 앞서 구글 코랩 환경을 구축하고 구글 드라이브를 마운트합니다.

3장에서는 Datasets 라이브러리와 Transformers 라이브러리를 활용하여 토크나이저 및 모델 준비, KLUE 데이터셋 전처리, 학습 파라미터 선정 및 학습 진행과 성능 평가를 실습해봅니다.

4장에서는 사전학습 단계부터 직접 진행해야 하는 경우를 대비하여 Tokenizers 라이브러리에 대해 살펴봅니다. 그리고 정확도, f1 스코어, 정밀도, 재현율을 기준으로 모델을 평가하는 Evaluate 라이브러리에 대해 알아봅니다.

5장에서는 트랜스포머 모델, 인코더 기반 모델, 디코더 기반 모델, 인코더-디코더 기반 모델의 기본 구조를 살펴보고 문장 분류, 다중 선택, 토큰 분류, 질의 응답, 조건부 생성, 인과적 언어 모델(Causal LM) 태스크의 코드와 결과를 확인해봅니다.

6장에서는 모델 구조별 대표 태스크에 대해 미세조정(파인튜닝, fine-tuning)을 진행합니다. 확률적 특징의 이해를 돕는 수식과 꼭 필요한 메서드의 파라미터까지 함께 살펴볼 수 있습니다.

7장에서는 PEFT, 양자화, QLoRA 미세조정과 같이 모델의 메모리 사용량은 줄이고 추론 속도는 높이는 경량화 기법에 대해 알아봅니다.

8장에서는 RLHF, SFT, PPO, DPO, KTO, CPO, ORPO, Best-of-N 샘플링, 보상 모델 트레이닝 등 정렬 조정에 해당하는 최신 방법론과 이를 강화학습을 위한 트랜스포머(TRL)를 통해 활용하는 방식에 대해 알아봅니다.

이 책이 필요한 독자

- 자연어 처리 분야에서의 인공지능에 대해 알고 싶은 분
- 언어 모델을 처음 접하는 대학생 또는 대학원생
- 허깅페이스 코드를 실습해보고 싶은 자연어 처리 초보자
- 언어 모델의 구조와 다양한 태스크를 샅샅이 살펴보고 싶은 분
- 허깅페이스에 대한 이해도는 있지만, 직접 부딪혀가며 코드로 기술을 레벨업하고 싶은 분
- 경량화 기법과 강화학습을 위한 트랜스포머에 대해 궁금한 분

출판사 리뷰 더보기펼치기