확장메뉴
주요메뉴


소득공제 베스트셀러

LLM을 활용한 실전 AI 애플리케이션 개발

: LLM의 기본부터 모델 학습, 임베딩, 벡터 데이터베이스로 만드는 RAG까지

허정준 저 / 정진호 그림 / 박재호 감수 | 책만 | 2024년 07월 25일   저자/출판사 더보기/감추기
리뷰 총점10.0 리뷰 8건 | 판매지수 24,321
베스트
IT 모바일 13위 | 국내도서 top100 1주
구매혜택

[책만 브랜드전] 라마와 앵무새 에코백 / [월간개발자 9월호] 유리텀블러 (포인트차감)

정가
32,000
판매가
28,800 (10% 할인)

품목정보

품목정보
발행일 2024년 07월 25일
쪽수, 무게, 크기 556쪽 | 1030g | 184*240*28mm
ISBN13 9791189909703
ISBN10 1189909707

이 상품의 태그

만화로 읽는 수능 고전시가

만화로 읽는 수능 고전시가

16,920 (10%)

'만화로 읽는 수능 고전시가' 상세페이지 이동

오투 중학 과학 2-2 (2024년)

오투 중학 과학 2-2 (2024년)

17,550 (10%)

'오투 중학 과학 2-2 (2024년)' 상세페이지 이동

오투 중학 과학 3-2 (2024년)

오투 중학 과학 3-2 (2024년)

15,750 (10%)

'오투 중학 과학 3-2 (2024년)' 상세페이지 이동

EBS 수능완성 영어영역 영어 (2024년)

EBS 수능완성 영어영역 영어 (2024년)

12,600 (10%)

'EBS 수능완성 영어영역 영어 (2024년)' 상세페이지 이동

오투 중학 과학 1-2 (2024년)

오투 중학 과학 1-2 (2024년)

14,850 (10%)

'오투 중학 과학 1-2 (2024년)' 상세페이지 이동

ETS 토익 정기시험 기출문제집 1000 Vol. 4 RC

ETS 토익 정기시험 기출문제집 1000 Vol. 4 RC

17,820 (10%)

'ETS 토익 정기시험 기출문제집 1000 Vol. 4 RC' 상세페이지 이동

EBS 수능완성 국어영역 독서·문학·화법과 작문 (2024년)

EBS 수능완성 국어영역 독서·문학·화법과 작문 (2024년)

12,600 (10%)

'EBS 수능완성 국어영역 독서·문학·화법과 작문 (2024년)' 상세페이지 이동

ETS 토익 정기시험 기출문제집 1000 Vol. 4 LC

ETS 토익 정기시험 기출문제집 1000 Vol. 4 LC

17,820 (10%)

'ETS 토익 정기시험 기출문제집 1000 Vol. 4 LC' 상세페이지 이동

2024 큰별쌤 최태성의 별별한국사 한국사능력검정시험 심화(1,2,3급) 상

2024 큰별쌤 최태성의 별별한국사 한국사능력검정시험 심화(1,2,3급) 상

14,400 (10%)

'2024 큰별쌤 최태성의 별별한국사 한국사능력검정시험 심화(1,2,3급) 상' 상세페이지 이동

2024 큰별쌤 최태성의 별별한국사 한국사능력검정시험 심화(1,2,3급) 하

2024 큰별쌤 최태성의 별별한국사 한국사능력검정시험 심화(1,2,3급) 하

13,950 (10%)

'2024 큰별쌤 최태성의 별별한국사 한국사능력검정시험 심화(1,2,3급) 하' 상세페이지 이동

쎈 중등 수학 2-2 (2024년)

쎈 중등 수학 2-2 (2024년)

14,850 (10%)

'쎈 중등 수학 2-2 (2024년)' 상세페이지 이동

EBS 수능특강 국어영역 독서 (2024년)

EBS 수능특강 국어영역 독서 (2024년)

10,350 (10%)

'EBS 수능특강 국어영역 독서 (2024년)' 상세페이지 이동

EBS 수능완성 국어영역 독서·문학·언어와 매체 (2024년)

EBS 수능완성 국어영역 독서·문학·언어와 매체 (2024년)

12,600 (10%)

'EBS 수능완성 국어영역 독서·문학·언어와 매체 (2024년)' 상세페이지 이동

해커스 토익 기출 VOCA (보카)

해커스 토익 기출 VOCA (보카)

11,610 (10%)

'해커스 토익 기출 VOCA (보카)' 상세페이지 이동

MAPL 마플 시너지 수학 (하) (2024년용)

MAPL 마플 시너지 수학 (하) (2024년용)

18,000 (10%)

'MAPL 마플 시너지 수학 (하) (2024년용)' 상세페이지 이동

EBS 수능완성 수학영역 수학1·수학2·미적분 (2024년)

EBS 수능완성 수학영역 수학1·수학2·미적분 (2024년)

11,700 (10%)

'EBS 수능완성 수학영역 수학1·수학2·미적분 (2024년)' 상세페이지 이동

쎈 중등 수학 3-2 (2024년)

쎈 중등 수학 3-2 (2024년)

14,400 (10%)

'쎈 중등 수학 3-2 (2024년)' 상세페이지 이동

신사고 쎈 초등 수학 6-2 (2024년)

신사고 쎈 초등 수학 6-2 (2024년)

15,750 (10%)

'신사고 쎈 초등 수학 6-2 (2024년)' 상세페이지 이동

쎈 중등 수학 1-2 (2024년)

쎈 중등 수학 1-2 (2024년)

14,850 (10%)

'쎈 중등 수학 1-2 (2024년)' 상세페이지 이동

EBS 수능특강 국어영역 문학 (2024년)

EBS 수능특강 국어영역 문학 (2024년)

10,350 (10%)

'EBS 수능특강 국어영역 문학 (2024년)' 상세페이지 이동

책소개 책소개 보이기/감추기

목차 목차 보이기/감추기

저자 소개 (3명)

줄거리 줄거리 보이기/감추기

[1부 LLM의 기초 뼈대 세우기]

1장 ‘LLM 지도’에서는 대규모 언어 모델이라는 빠르게 발전하고 있는 분야에서 독자들이 길을 잃지 않도록 큰 흐름을 먼저 살펴본다. 1장을 통해 LLM 지도를 얻고 나면 이 책과 LLM에 대해 큰 줄기를 잡을 수 있다.

2장 ‘LLM의 중추, 트랜스포머 아키텍처 살펴보기’에서는 현대 LLM의 기반이 되는 트랜스포머 아키텍처를 알아본다. 트랜스포머 아키텍처는 처음 접했을 때 직관적으로 이해하기가 쉽지는 않지만, 친절한 설명과 함께 코드 레벨에서도 살펴봄으로써 트랜스포머 아키텍처라는 큰 산을 넘어가도록 돕는다.

3장 ‘트랜스포머 모델을 다루기 위한 허깅페이스 트랜스포머 라이브러리’에서는 트랜스포머 아키텍처 기반 모델을 쉽게 활용할 수 있도록 도와주는 허깅페이스의 트랜스포머 라이브러리 사용법을 알아본다. 허깅페이스 트랜스포머 라이브러리는 오픈소스 LLM을 활용할 때 자주 사용되며 이제는 거의 표준에 가까운 라이브러리가 됐다. 3장에서 라이브러리 사용법을 잘 익히고 나면, 다양한 모델을 거의 동일한 방법으로 활용할 수 있다.

4장 ‘말 잘 듣는 모델 만들기’에서는 말을 ‘잘 만들기만 하던’ 언어 모델이 어떻게 사용자의 말을 ‘잘 듣고 지시에 따르는’ 모델로 바뀌었는지 살펴본다. 2022년 11월 공개된 OpenAI의 챗GPT는 사용자의 말을 찰떡같이 알아듣고 사용자의 지시에 따라 응답함으로써 가장 성공적인 AI 제품이 됐다. 4장에서는 OpenAI가 어떻게 챗GPT같이 말 잘 듣는 모델을 만들었는지 살펴본다.

[2부 LLM 길들이기]

5장 ‘GPU 효율적인 학습’에서는 LLM처럼 파라미터가 많고 용량이 큰 모델을 작은 GPU에서도 학습시킬 수 있는 방법을 알아본다. 이 책에서 개발 환경으로 사용하는 구글 코랩(Colab)은 무료 버전에서는 메모리가 16GB인 GPU를 지원한다. 모델 자체의 용량만 10GB가 넘는 언어 모델을 어떻게 메모리가 16GB인 작은 GPU에서 학습시킬 수 있는지 5장에서 확인할 수 있다.

6장 ‘sLLM 학습하기’에서는 직접 작은 언어 모델(sLLM)을 실습데이터로 학습시켜 자연어에서 SQL을 생성하는 Text2SQL 모델을 만들어 본다. Text2SQL 모델은 기업에서 자주 발생하는 데이터 추출 요청을 언어 모델이 수행함으로써 데이터 조직의 생산성을 높이고 SQL에 익숙하지 않은 팀원의 데이터 접근성을 높이는 데 기여할 수 있다. 6장에서는 LLM을 통한 학습 데이터의 생성과 LLM미세 조정을 통해 준수한 성능의 sLLM을 만드는 방법을 알아본다.

7장 ‘모델 가볍게 만들기’에서는 언어 모델을 작게 만드는 방법과 효율적으로 추론하도록 만드는 방법을 알아본다. sLLM을 활용하는 경우 대부분의 GPU 비용은 학습이 아닌 서빙에서 발생한다. 따라서 학습시킨 모델을 작게 만들고 효율적으로 추론하도록 만들어서 GPU 비용을 크게 낮출 수 있다. 7장에서는 비용 효율적으로 LLM을 서빙하기 위한 다양한 방법을 살펴본다.
8장 ‘sLLM 서빙하기’에서는 LLM을 효율적으로 서빙할 수 있도록 도와주는 vLLM 라이브러리를 활용해 LLM을 서빙하는 방법을 알아본다. 6장에서 학습시킨 모델을 허깅페이스 트랜스포머 라이브러리로 실행할 때와 vLLM으로 실행할 때의 속도 차이를 확인함으로써 vLLM의 강력함을 확인할 수 있다.

[3부 LLM을 활용한 실전 애플리케이션 개발]

9장 ‘LLM 애플리케이션 개발하기’에서는 LLM 애플리케이션을 개발하기 위해 모델 이외에도 다양한 구성요소가 필요하다는 사실을 살펴본다. LLM 애플리케이션은 중심이 되는 모델과 모델에 최신 정보나 조직의 내부 정보를 추가하는 검색 증강 생성, LLM 추론 비용을 줄이는 LLM 캐시, 생성된 결과를 검토하는 데이터 검증 등이 필요한다.

10장 ‘임베딩 모델로 데이터 의미 압축하기’에서는 검색 증강 생성에서 정보를 저장하고 검색할 때 사용하는 임베딩 모델에 대해 알아본다. 임베딩이란 데이터의 의미를 유지하면서 숫자의 배열인 벡터 형태로 변환하는 방법을 말한다. 임베딩 모델을 활용해 텍스트 데이터를 벡터로 변환하면 의미적으로 유사하거나 관련 있는 데이터를 검색해 활용할 수 있다.

11장 ‘자신의 데이터에 맞춘 임베딩 모델 만들기: RAG 개선하기’에서는 10장에서 살펴본 임베딩 모델을 자신의 데이터에 맞춰 미세 조정할 수 있는 방법을 알아본다. 검색 증강 생성을 활용하려는 데이터가 임베딩 모델을 학습할 때 사용되지 않은 기업의 내부 데이터이거나 최신의 데이터라면, 기존에 학습된 임베딩 모델을 활용할 경우 검색 성능이 만족스럽지 않을 수 있다. 그런 경우 임베딩 모델을 자신의 데이터에 맞춰 추가 학습함으로써 검색 성능을 높일 수 있다. 또 검색 쿼리와 검색 문서를 직접 비교해서 관련도(relevancy)에 따라 검색 순위를 재조정하는 리랭커(Reranker)를 활용해 검색 성능을 높이는 방법도 살펴본다.
12장 ‘벡터 데이터베이스로 확장하기: RAG 구현하기’에서는 벡터로 변환된 텍스트 임베딩을 저장하고 검색할 때 사용하는 특수한 데이터베이스인 벡터 데이터베이스에 대해 알아본다. 벡터 데이터베이스에서 많이 활용되는 저장 및 검색 알고리즘인 HNSW(Hierarchical Navigable Small World)의 원리와 최적화 방법을 살펴보고 대표적인 벡터 데이터베이스인 파인콘(Pinecone)을 활용해 멀티 모달 검색을 구현하는 실습을 진행한다.

13장 ‘LLM 운영하기’에서는 머신러닝 모델을 효과적으로 운영하기 위해 사용하던 MLOps를 LLM에 맞춰 확장한 LLMOps에 대해 알아본다.

기존의 머신러닝 모델과 LLM의 차이점을 통해 LLMOps에서 더 집중해야 하는 부분을 소개한다. 대표적으로 LLM은 기존 머신러닝 모델에 비해 평가하기 어렵다. 아직까지도 LLM의 평가는 정답이 없고 모두가 고민하고 있는 주제다. 13장을 통해 LLM의 평가가 왜 어려운지, LM을 평가하기 위한 여러 접근 방식을 살펴본다.

[4부 멀티 모달, 에이전트 그리고 LLM의 미래]

14장 ‘멀티 모달 LLM’에서는 텍스트 이외에 이미지를 처리하는 LLM에 대해 알아본다. 이미지와 텍스트 데이터를 함께 처리해서 동일한 임베딩 공간에서 매핑할 수 있는 OpenAI의 CLIP 모델과 텍스트 입력을 바탕으로 이미지를 생성하는 DALL-E 모델을 알아보고 이미지와 텍스트를 함께 입력으로 받아 처리하는 오픈소스 모델인 LLaVa를 통해 멀티 모달 LLM의 기본 원리를 살펴본다.

15장 ‘LLM 에이전트’에서는 LLM을 확장하는 에이전트 아키텍처에 대해 알아본다. 에이전트 아키텍처란 LLM에 장기 기억, 인터넷 검색과 같은 도구, 작업을 분해하고 순차적으로 해결하는 계획 기능 등을 추가해 LLM의 성능을 몇 단계 높이는 더 발전된 LLM 시스템이다. 15장에서는 대표적인 에이전트 라이브러리인 마이크로소프트의 AutoGen을 활용해 LLM 에이전트를 구현하는 실습을 진행한다.

16장 ‘새로운 아키텍처’에서는 입력이 길어질수록 추론에 많은 시간과 연산 비용이 드는 트랜스포머 아키텍처의 단점을 보완하기 위해 새롭게 제안된 맘바(Mamba) 아키텍처에 대해 알아본다. 맘바 아키텍처는 기존에 자연어 처리에서 사용하던 순환신경망(Recurrent Neural Network, RNN)을 변형해 추론의 효율성을 유지하면서도 트랜스포머 아키텍처와 비슷한 성능을 보여 많은 주목을 받았다. 16장에서는 맘바 아키텍처에 대해 알아보며 새로운 아키텍처의 가능성을 살펴본다.

[부록]

'실습을 위한 준비 사항'에서는 이 책의 실습을 진행할 때 필요한 사항을 소개합니다. 먼저 실습 환경인 구글 코랩 사용법을 살펴본 다음, 실습에 사용한 LLM과 데이터셋을 업로드하고 다운로드할 때 필요한 허깅페이스 토큰을 확인하는 방법을 설명합니다. 마지막으로 대표적인 상용 LLM API인 OpenAI의 API 토큰을 생성하고 확인하는 방법을 소개합니다.

출판사 리뷰 출판사 리뷰 보이기/감추기

추천평 추천평 보이기/감추기

이 책은 최신 언어 모델의 핵심 기술과 실제 활용 방법을 체계적으로 잘 설명하고 있습니다. LLM 모델의 기초부터 트랜스포머 아키텍처, BERT, GPT, T5 등 다양한 모델에 대한 상세한 설명을 제공하며, 허깅페이스 트랜스포머 라이브러리를 활용한 실제 코드 예제를 통해 쉽게 이해할 수 있도록 돕습니다.

특히 LLM 관련 기술의 이론적 배경과 최적화를 위한 다양한 방법론을 알기 쉽게 설명하며, LLM 애플리케이션의 핵심인 RAG 구현에 대한 상세한 내용을 포함하고 있습니다. LLM과 RAG의 통합적 이해를 원하는 독자들에게 최고의 선택이 될 것입니다.
- 강재원 (여기어때컴퍼니 DNA센터 비즈니스 인사이트팀 팀장)
“대규모 언어 모델의 기초부터 실무 적용까지 한 권에 담은 완벽한 지침서”
이 책은 대규모 언어 모델(LLM)의 이론과 실무를 깊이 있게 다룹니다. 저자는 『파이토치 라이트닝으로 시작하는 딥러닝』 등 권위 있는 서적을 번역하고 수많은 강의와 논문을 연구한 딥러닝과 LLM 분야의 전문가입니다. 그의 풍부한 실무 경험과 창의적인 문제해결 능력은 자연어 처리 기술을 비자연어 및 비전통적 문제에 적용하는 독창적인 접근방식을 제시했으며, 이는 동료들에게 깊은 인상과 영감을 주었습니다.

딥러닝과 언어 모델을 포함한 자연어 기술은 꾸준히 발전해 왔지만, 챗GPT의 출현은 ‘아이폰 모멘트(iPhone Moment)’에 비유될 정도로 기술의 대중화와 삶에 혁신적 변화를 촉진하고 있습니다. 누구나 손쉽게 도구를 활용하여 기술에 접근할 수 있게 되었지만, 급변하는 환경에서 기초 개념과 기술 원리에 대한 심도 있는 이해는 여전히 필수적입니다.

이 책은 복잡한 개념을 직관적으로 설명하며, 시각 자료와 실용적인 코드 예제를 제공하여 초보자부터 전문가까지 쉽게 이해하고 활용할 수 있습니다. 또한 현업의 문제들과 최신 기술 트렌드를 포괄적으로 다루어 실무 적용에 최적화되어 있습니다.

LLM의 기초를 배우고자 하는 입문자, 최신 기술을 실무에 적용하려는 개발자, 다양한 이해관계자에게 기술을 설명하려는 전문가 및 교육자 등 기술의 본질을 이해하고 창의적인 문제 해결 능력을 키우고자 하는 모든 이에게 유용한 지침서가 될 것입니다.
- 김경문 ((주)크몽 데이터팀 리드)
2024년 가장 뜨거운 키워드는 LLM과 생성형 AI이며, 이제 LLM은 주요한 IT 인프라스트럭처로 인식되고 있습니다. 기술이 발전하면서 LLM은 데이터 과학자의 전유물이 아닌 LLM 개발자, LLM 운영자, LLM 애플리케이션 개발자 등 다양한 영역에서 활용을 고민하는 키워드가 됐습니다. LLM을 활용하는 분야가 늘어나면서 LLM을 단순히 블랙박스가 아닌 기술이나 아키텍처로서 이해해야 하는 직군이 늘어가고 있습니다. 그러나 트랜스포머 기반의 LLM을 학습하기 위한 시작점을 찾기란 여전히 어려운 것이 사실입니다. 머신러닝, 딥러닝, RNN으로 시작해서 LLM까지 이해하기에는 그 여정이 너무 험난합니다.

이 책은 LLM을 깊이 있게 이해하고 싶은 분들에게 전체적인 개념과 흐름, 개념, 작업 개요를 그저 학문의 용어가 아닌 ‘실무의 용어’로 설명하는 책입니다. 현업 실무자, 그리고 신규 입문자를 위해 이론과 수식이 가득한 공간을 친숙한 용어로 풀이해 기나긴 LLM 여정을 완주할 수 있도록 돕는 것이 이 책의 장점이라고 생각합니다. LLM 인프라스트럭처를 대중화하는 실무서로서 현업에서 LLM을 활용해야 하는 분들과 새롭게 입문하시는 분들에게 강력히 추천합니다. 결코 쉽지 않은 학문 지식을 실무 정보로 흥미롭게 풀어내 주신 저자의 노력에 감사드립니다.
- 김태완 (한국오라클 상무)
LLM 기술이 빠르게 발전하는 가운데, 안타깝게도 관련 서적들은 그 속도를 따라잡지 못했다. 최신 기술은 주로 논문이나 영문 블로그를 통해 접할 수밖에 없었고 이는 책을 사랑하는 독자로서 아쉬운 일이었다. 그러나 이제 그 갈증을 해소할 수 있게 되었다.

이 책은 LLM 관련 최신 기술을 총망라할 뿐만 아니라, 영문으로도 접하기 힘든 고급정보를 우리말로 쉽게 설명해 준다. 특히 4장 ‘말 잘 듣는 모델 만들기’는 실제 챗GPT와 같은 언어 모델을 구축하는 과정을 가상의 코딩 테스트 서비스 개발에 빗대어 명쾌하고 흥미롭게 설명한다. 사전 학습, 미세 조정, 채점 모델, 강화 학습까지 전 과정을 단계별로 상세히 다루어 챗GPT의 개발 원리를 누구나 쉽게 이해할 수 있게 해준다. 더불어 정진호 작가가 직접 그린 친절한 일러스트는 복잡한 LLM의 구축 과정과 동작 원리를 시각적으로 이해하는 데 큰 도움을 준다. 이 외에도 이 책은 LLM 관련 아키텍처, 라이브러리, 최적화 기법 등 연구자와 개발자에게 필수적인 고급 정보로 가득하다.

이제 LLM은 모든 개발자에게 있어 선택이 아닌 필수 지식으로 자리 잡고 있다. 『LLM을 활용한 실전 AI 애플리케이션 개발』은 이러한 필수 핵심 지식을 쌓는 데 최적의 안내서가 될 것이다. LLM 분야에 관심 있는 독자에게, 나아가 AI와 소프트웨어 개발의 미래를 준비하는 모든 독자에게 이 책을 강력히 추천하는 바이다.
- 박상길 (디노티시아 LLM 연구개발, 전 현대자동차 인공지능 테크리드, 『자바 알고리즘 인터뷰』 저자)
이 책을 읽으면서, 2010년 초반에 딥러닝을 처음 접했을 때 이처럼 좋은 책이 있었다면 얼마나 좋았을까라는 생각을 했습니다. 당시 한글로 된 자료는 턱없이 부족했고, 논문의 복잡한 수식은 현장의 엔지니어가 이해하기에 어려웠습니다. 인터넷의 자료는 도구를 설명하는 데 그쳐서 핵심적인 개념을 습득하고 응용하는 데 많은 시간을 들여야 했습니다.

이 책은 챗GPT로 대표되는 LLM의 시대에 그때와 비슷한, LLM에 대한 갈증을 완벽하게 해소해 줍니다. 저자는 LLM에 대한 전문적인 이해를 바탕으로, 복잡한 개념을 어려운 수식 없이 누구나 이해할 수 있도록 쉽게 설명합니다. 또한 LLM의 핵심요소를 직접 구현해 보며 개념을 체득할 수 있도록 친절히 안내합니다. 그리고 당장 제품에 적용할 수 있을 정도로 높은 수준의 응용 사례를 제공합니다.

LLM의 기본 개념을 이해하고 싶거나, LLM 애플리케이션을 효과적으로 개발해야 하거나, 이미 구축한 LLM 시스템을 운영하면서 최적화가 필요한 모든 분들에게 이 책을 추천합니다.
- 송준이 ((주)크몽 CTO)
이 책은 언어 모델의 기초부터 최신 기술 동향, 애플리케이션 개발 및 운영, 실전 개발 과정에서의 유의점까지, LLM에 대한 거의 모든 것을 담고 있는 백과사전 같은 가이드다. 많은 내용을 다룰 뿐 아니라 트랜스포머 아키텍처의 작동 원리, 파인 튜닝 등 LLM의 핵심 기반 기술을 자세하고 친절하게 소개하고 있어, 독자들이 LLM 기술에 대한 통찰력을 가질 수 있도록 도움을 준다. 이론적인 설명에 더해 실습 예제 코드로도 설명 내용을 보완하고 있기에 훨씬 이해가 잘되는 것도 이 책의 장점이다.

핵심 내용뿐만 아니라 sLLM, RAG, 멀티 모달, LLM 에이전트 등 LLM 분야의 최신 기술까지 다루므로 LLM에 대해 체계적이고 종합적으로 공부해 보고 싶다면 이 책이 좋은 교과서가 될 수 있을 것이다.
- 최재원 (아주대학교 교수학습개발센터 학습데이터 분석 및 AI교육 담당 연구원)
이 책은 출간된 현재 시점에서 대규모 언어 모델에 대해 우리가 알아야 할 거의 모든 부분을 다룬다. 만약 신경망 유닛이나 역전파와 정규화나 텐서 연산 등 기초적인 인공지능 개념에 대해 파악했고 파이토치 등을 통해 기본적인 학습과 추론을 사용해 본 독자라면 이제 이 책의 내용을 소화할 차례다. AI 분야의 인재가 부족한 상황에서 이렇게 자세하고 친절하게 그리고 최신 내용을 모두 포함해 언어 모델을 설명한 도서라니 목차부터 매력적이지 않을 수 없다.

이 책은 순환신경망, 어텐션, 트랜스포머, BERT, 임베딩, 파인 튜닝과 RLHF 그리고 LoRA 등의 생성형 AI 학습의 역사와 모델 훈련과 추론에 대한 세세한 내용을 자세히 다룬다. 동시에, 반향을 일으켰던 여러 논문들도 소개하며 실제 모델 훈련 예제까지 알려준다. 모델을 연구 개발하면서 참조하게 될 허깅페이스와 깃허브의 여러 유용한 데이터와 라이브러리까지 소개하고 있으니, 본격적으로 LLM에 발을 들여놓은 분이나 이미 알고 있더라도 관련 지식을 한번 정리하고 싶은 사람에게 많은 도움이 될 것으로 보인다. 실제 훈련 과정에서 GPU를 효율적으로 활용하는 방법에 대한 내용까지 다루며, 만들어진 모델이 최신 지식을 참조해 답을 할 수 있도록 RAG를 적용하는 방법과 에이전트로 만들어진 모델의 평가와 트랜스포머 이후의 아키텍처 등 이 분야의 향후 발전 방향까지도 가늠할 수 있도록 충실하게 채운 저자의 노력이 독자에게 큰 배움을 선사하며 빛을 발하리라 기대한다.
- 현동석 (네이버 서치 데이터 리더)
LLM(대규모 언어 모델) 인공지능 기술은 그 복잡성과 눈부신 발전 속도로 인해 종합적으로 파악하기 매우 어려운 분야입니다. 이러한 상황에서 이 책을 접하게 된 것은 저에게도 큰 기쁨이었습니다.

저자는 먼저 LLM 기술의 전체적인 큰 그림을 명쾌하게 제시한 후, 각 요소 기술을 깊이 있게 다룹니다. 또한 각 기술이 본질적으로 복잡해서 스스로 이해하거나 남에게 설명해 주기가 꽤 어려움에도 불구하고, 독자들을 배려하여 최대한 쉽게 설명합니다. 이러한 접근 방식 덕분에 저 또한 각 기술을 이해하는 데 큰 도움을 받았습니다.

급변하는 LLM 기술 분야에서 이 책은 포괄적이면서도 깊이 있는 이해를 제공하기에, 이 분야에 대한 체계적인 지식을 갖추고자 하는 이에게 훌륭한 길잡이가 될 것입니다. AI와 LLM 기술에 관심 있는 독자들에게 이 책을 진심으로 추천합니다.
- 잔재미코딩 데이브 리(Dave Lee) (노이먼스 & 튜링스 CTO)
허정준님의 책은 LLM의 중추가 되는 트랜스포머 아키텍처부터 오픈소스 LLM의 활용과 미세 조정, 라마인덱스를 활용한 RAG 구현과 개선, 멀티모달 LLM과 에이전트까지 폭넓은 주제를 알차게 구성해 다루고 있습니다. 주요 핵심 개념들을 이해하기 쉽게 정리하고 실무자들이 손쉽게 따라할 수 있게 한 점이 특히 인상적이었습니다.

실무에 유용한 RAG 프로젝트 실습과 MLOps, LLMOps에 대한 소개는 이 책의 큰 강점으로, 실무에 바로 적용할 수 있는 지식을 제공합니다. LLM에 입문하고자 하는 사회 초년생과 현업 개발자 모두에게 강력히 추천합니다.
- 송호연 (Contxts.io (NFTBank) VP of AIOps)

회원리뷰 (3건) 회원리뷰 이동

한줄평 (5건) 한줄평 이동

총 평점 10.0점 10.0 / 10.0

배송/반품/교환 안내

배송 안내
반품/교환 안내에 대한 내용입니다.
배송 구분 예스24 배송
  •  배송비 : 무료배송
포장 안내

안전하고 정확한 포장을 위해 CCTV를 설치하여 운영하고 있습니다.

고객님께 배송되는 모든 상품을 CCTV로 녹화하고 있으며, 철저한 모니터링을 통해 작업 과정에 문제가 없도록 최선을 다 하겠습니다.

목적 : 안전한 포장 관리
촬영범위 : 박스 포장 작업

  • 포장안내1
  • 포장안내2
  • 포장안내3
  • 포장안내4
반품/교환 안내

상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내에 대한 내용입니다.
반품/교환 방법
  •  고객만족센터(1544-3800), 중고샵(1566-4295)
  •  판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  •  출고 완료 후 10일 이내의 주문 상품
  •  디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  •  중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
  •  모바일 쿠폰의 경우 유효기간(발행 후 1년) 내 등록하지 않은 상품
반품/교환 비용
  •  고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  •  직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음

    단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제

    •  오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소
    •  오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소
  •  직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음

    단, 당일 00시~13시 사이의 주문은 취소 수수료 면제

  •  박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  •  소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  •  소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  •  복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  •  소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  •  디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  •  eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  •  모바일 쿠폰 등록 후 취소/환불 불가
  •  중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  •  LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등)
  •  시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  •  전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  •  상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에
따른 배상
  •  대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리
스프링분철 서비스를 선택하세요.
수량감소 수량증가 28,800
  •  다운받은 쿠폰은 결제 페이지에서 적용해 주세요.
  •  분철옵션 선택 시, 배송일이 변경될 수 있습니다.
  •  분철상품은 해외배송이 불가합니다.
1   28,800

스프링분철 신청 가능

뒤로 앞으로 맨위로 공유하기