이미 소장하고 있다면 판매해 보세요.
추천사
들어가며 이 책의 구성 실습 환경 설정 Chapter 1 랭체인 살펴보기 1. 랭체인 개요 __1.1 랭체인 주요 패키지 __1.2 랭체인 버전별 기능 업데이트 __1.3 왜 랭체인을 사용해야 하는가? __1.4 랭체인의 주요 활용 사례 2. 대규모 언어 모델 __2.1 랭체인 vs 오픈AI API __2.2 대규모 언어 모델 파라미터 설정 __2.3 랭체인에서 사용할 수 있는 주요 대규모 언어 모델 3. 랭체인 표현 언어 __3.1 러너블 표준 인터페이스 __3.2 러너블을 체인으로 연결하는 방법 4. 프롬프트 __4.1 퓨샷 프롬프트 __4.2 프롬프트 허브 5. 출력 파서 __5.1 출력 파서의 세 가지 주요 메서드 __5.2 PydanticOutputParser __5.3 SimpleJsonOutputParser __5.4 JsonOutputParser 6. 메모리 관리: 대화 기록 유지 __6.1 기본적인 대화 이력 전달 __6.2 대화 이력 관리 및 처리 __6.3 자동 대화 이력 관리 __6.4 대화 이력 요약 및 트리밍 Chapter 2 검색 증강 생성 기초와 실습 1. 검색 증강 생성 개요 __1.1 텍스트 임베딩 __1.2 코사인 유사도 __1.3 랭체인 임베딩 API 활용 2. 문서 로더 __2.1 웹 페이지 로더 __2.2 PDF 로더 __2.3 CSV 로더 3. 텍스트 분할 __3.1 길이와 구분자로 분할하는 재귀적 문자 텍스트 분할 __3.2 의미 기반으로 분할하는 시맨틱 청킹 4. 벡터 데이터베이스 __4.1 크로마 __4.2 파이스 5. RAG 챗봇 실습 __5.1 RAG 챗봇 구현 __5.2 챗봇에 스트림릿 UI 적용 Chapter 3 멀티모달 RAG를 활용한 복합 데이터 처리 1. 멀티모달 RAG 개요 __1.1 멀티모달 RAG란? __1.2 멀티모달 RAG가 어려운 이유 2. 멀티모달 RAG 구현 방법 __2.1 모든 모달리티를 동일한 벡터 공간에 포함하기 __2.2 모든 모달리티를 하나의 기본 모달리티로 표현하기 __2.3 서로 다른 모달리티를 별도의 저장소에서 다루기 3. 멀티모달 RAG 실습 __3.1 환경 설정 __3.2 데이터 전처리 __3.3 멀티-벡터 검색기 __3.4 멀티모달 RAG 구현 Chapter 4 검색과 응답을 최적화하는 RAG 고도화 전략 1. 청킹 전략 __1.1 부모-자식 분할 2. 질의 변형 __2.1 다중 질의 생성 __2.2 가상 문서 임베딩 3. 검색 알고리즘 __3.1 희소 검색 __3.2 밀집 검색 __3.3 앙상블 검색 4. 문서 후처리 __4.1 고성능 대규모 언어 모델 기반 리랭킹 __4.2 크로스 인코더 기반 리랭킹 5. 확장된 RAG 방법론 __5.1 Self-RAG 개요 __5.2 Self-RAG 구현 Chapter 5 지식 그래프를 활용한 그래프 RAG 1. 그래프 RAG 개요 __1.1 기존 RAG 방식의 한계 __1.2 지식 그래프란? __1.3 그래프 RAG의 동작 과정 2. 그래프 DB 구축 __2.1 그래프 DB 구축 과정 __2.2 그래프 DB 구축 실습 3. 그래프 RAG 질의 __3.1 그래프 RAG 질의 과정 __3.2 그래프 RAG 질의 실습 4. Neo4j와 랭체인을 활용한 GraphRAG 구현 __4.1. 지식 그래프와 Neo4j 통합 Chapter 6 랭그래프로 설계하는 RAG 파이프라인 1. 랭그래프의 구성요소 __1.1 그래프 __1.2 상태 __1.3 노드 __1.4 에지 2. 랭그래프 활용 __2.1 루프 구현하기 __2.2 조건문 구현하기 __2.3 스트리밍 __2.4 상태 저장하기 __2.5 루프 개입하기 3. 랭그래프 실습 __3.1 자체교정-RAG __3.2 코드 어시스트 챗봇 Chapter 7 리액트 에이전트를 활용한 RAG 1. 생각의 사슬 2. 에이전트 RAG __2.1 라이브러리와 데이터 준비 __2.2 에이전트 도구 만들기 __2.3 에이전트 프롬프트 설정 __2.4 에이전트 객체 생성 __2.5 에이전트 RAG 실습 Chapter 8 RAG 성능을 높이는 LLM 파인튜닝 1. RAFT 논문 살펴보기 __1.1 네거티브 샘플 __1.2 생각의 사슬 2. 성능 향상을 위한 팁 __2.1 답변 없음 데이터 __2.2 출처 인용 3. RAG 학습 데이터셋 살펴보기 __3.1 학습 데이터 소개 __3.2 학습 데이터 탐색 4. 로컬 LLM Qwen 파인튜닝하기 __4.1 런팟을 이용한 실습 환경 설정 __4.2 데이터 전처리 __4.3 Qwen 템플릿 이해하기 __4.4 로라 학습을 위한 설정값 __4.5 학습을 위한 설정값 __4.6 정수 인코딩 __4.7 모델 테스트하기 __4.8 GPU 종료하기 Chapter 9 임베딩 모델 파인튜닝 1. 임베딩 모델의 학습 원리 __1.1 대조 학습 __1.2 데이터셋 구성 __1.3 배치 내 네거티브 샘플링 __1.4 MultipleNegativesRankingLoss __1.5 학습 코드의 이해 2. 학습 시 성능을 높이는 방법 __2.1 배치 크기 키우기 __2.2 하드 네거티브 선정 __2.3 그 외 학습 성능 향상을 위한 팁 3. 실전 파인튜닝 __3.1 데이터 로드하기 __3.2 하드 네거티브 선정 __3.3 합성 데이터 생성 __3.4 모델 로드하기 __3.5 평가 데이터 전처리 __3.6 모델 학습하기 __3.7 검색 성능 평가 지표 __3.8 파인튜닝 모델 평가하기 마치며 찾아보기 |
Bryce Yoo
브라이스 유의 다른 상품
멀티모달부터 그래프 RAG, 랭그래프, ReAct 에이전트, 파인튜닝까지
RAG로 완성하는 실전 LLM 서비스 최근 챗GPT로 대표되는 거대 언어 모델(LLM)은 뛰어난 성능에도 불구하고, 최신 정보나 특정 문서의 세부 내용을 제공하지 못하는 한계가 있습니다. 이런 문제를 해결하는 대표적인 기술이 바로 RAG(검색 증강 생성)입니다. 이 책은 LLM 기반 서비스를 구축하는 데 꼭 필요한 RAG의 기본 원리부터 다양한 고급 기법까지 폭넓게 다룹니다. 기초적인 RAG 개념뿐 아니라 멀티모달 RAG, 그래프 RAG, 랭그래프를 활용한 파이프라인, 에이전트 RAG, 파인튜닝 등 실무에서 요구하는 심화 주제를 단계별로 안내합니다. 또한 텍스트 임베딩, 의미 기반 텍스트 분할, 벡터 데이터베이스 활용 등 RAG 구현에 필수적인 기술을 체계적인 이론과 실습으로 함께 다룹니다. 이를 통해 LLM 서비스 개발이 처음인 초보자부터 실전 감각을 키우고 싶은 개발자까지 모두에게 유용한 지식과 노하우를 제공합니다. 특히 이 책에서는 RAG 구현에 최적화된 프레임워크인 랭체인(LangChain) 활용법을 자세히 다룹니다. 랭체인은 LLM 기반의 AI 애플리케이션을 쉽고 빠르게 개발할 수 있도록 다양한 기능과 모듈을 제공하는 강력한 프레임워크입니다. 모든 예제는 구글 코랩(Google Colab)과 랭체인을 활용하여 복잡한 환경 설정 없이 누구나 손쉽게 따라 할 수 있도록 구성했습니다. 책에서 제공하는 생생한 RAG 실습을 차근차근 따라 하다 보면, 기업 데이터 기반의 챗봇이나 지식 검색 시스템과 같은 실제 비즈니스 현장에 바로 적용 가능한 AI 애플리케이션 개발 능력을 자연스럽게 습득하게 될 것입니다. 이런 분께 추천! ● AI 개발에 관심이 있는 초중급 파이썬 사용자 ● 랭체인과 RAG를 학습하고 싶은 대학생, 개발자 커뮤니티, 연구자 ● LLM 및 RAG 기반 시스템을 개발하고자 하는 개발자 및 엔지니어 ● 기업 데이터 기반 챗봇 및 지식 검색 시스템 구축을 고려 중인 실무자 - 이 책의 구성 - 이 책은 총 9장으로 구성되어 있으며, RAG 기술의 핵심 원리부터 실무에 적용 가능한 다양한 방법까지 단계적으로 다룹니다. 1장에서는 랭체인의 주요 개념과 기능들을 자세히 설명합니다. 랭체인에서 활용하는 언어 모델의 이해부터 프롬프트 작성법, 출력 파서 활용, 메모리 관리 기법 등 RAG 구현의 바탕이 되는 개념을 꼼꼼히 다룹니다. 2장에서는 본격적으로 RAG의 기본 원리를 배우고 실습합니다. 텍스트 임베딩과 코사인 유사도 개념, 문서 로딩 및 분할 방법, 그리고 벡터 데이터베이스를 이용한 기본적인 챗봇 구현 과정을 따라가면서 기초를 튼튼하게 다집니다. 3장에서는 텍스트를 넘어 이미지 등 다양한 데이터 타입을 함께 활용할 수 있는 멀티모달 RAG를 살펴봅니다. 멀티모달 RAG의 필요성부터 구현 방식과 실제 실습까지 진행하며 실무에 가까운 활용법을 익힙니다. 4장에서는 RAG의 성능을 높이기 위한 고급 전략을 구체적으로 학습합니다. 효과적인 문서 분할(청킹) 전략과 질의 변형 방법, 검색 알고리즘과 문서 리랭킹, 그리고 이를 더욱 발전시킨 Self-RAG 기법까지 다룹니다. 5장에서는 지식 그래프를 활용하여 RAG의 한계를 극복하는 그래프 RAG를 소개합니다. Neo4j를 활용하여 그래프 데이터베이스를 구축하고 이를 실제 질의에 활용하는 방법을 실습합니다. 6장에서는 랭그래프를 활용하여 RAG 시스템을 더 유연하고 정교하게 만드는 방법을 다룹니다. 랭그래프의 개념과 핵심 구성 요소를 이해하고, 이를 활용한 조건문과 루프 구조 등 복잡한 RAG 구현을 실습을 통해 익힙니다. 7장에서는 리액트 에이전트를 활용하여 더욱 지능적이고 자동화된 RAG 시스템을 구현하는 방법을 설명합니다. 에이전트의 동작 원리를 이해하고, 에이전트 도구 제작 및 실제 RAG 실습을 진행합니다. 8장에서는 RAG의 성능을 더욱 높이기 위한 언어 모델의 파인튜닝을 다룹니다. 파인튜닝의 필요성과 데이터 준비 방법, 학습 환경 구축 및 실제 로컬 LLM 모델(Qwen)을 파인튜닝하는 과정까지 상세하게 설명하여 실무에 직접 적용 가능한 수준까지 안내합니다. 마지막으로, 9장에서는 RAG의 핵심인 검색 성능을 극대화하기 위해 임베딩 모델을 직접 파인튜닝하는 방법을 심층적으로 다룹니다. 효과적인 임베딩 학습 방법의 원리와 활용법을 배우고, 실제 데이터를 이용한 학습 데이터 구축부터 모델 훈련, 검색 성능 평가, 성능 최적화 팁까지 실전적인 지식을 습득합니다. |
시중의 RAG 책을 모두 섭렵해왔지만, 모두 튜토리얼에 그친 책들만 있어 LLM 개발에 대한 염증이 있던 차였습니다. 이 책은 고급 RAG, Graph RAG, 에이전트, LangGraph, LLM Fine-tuning까지 LLM을 이용한 서비스 개발에 필요한 다양한 지식과 프로젝트 코드를 망라한 책입니다. 단언컨대, 지금까지 나온 그 어떤 Langchain과 RAG 책 중 최고의 책이라 말할 수 있습니다. - 김수종 (AWS 컨설턴트)
|
이 책은 LangChain을 활용한 AI 애플리케이션 개발을 체계적으로 설명하며, 단순한 RAG 구축을 넘어 Advanced RAG, MultiModal RAG, Graph RAG 등 고급 기법까지 깊이 있게 다룹니다. 또한, 최근 LangChain과 비교되며 주목받고 있는 LangGraph에 대한 설명과 차별점도 포함되어 있어, 보다 폭넓은 시각을 제공하는 것이 특징입니다.
무엇보다도, 이 책은 단순한 이론서가 아닙니다. RAG를 서비스에 적용한 사람들의 경험이 녹아 있으며, 실전 프로젝트에서 활용할 수 있는 다양한 실용적 예제와 인사이트를 제공합니다. LLM을 활용한 AI 서비스 개발을 고민하는 개발자들에게, 이 책은 RAG의 모든 것을 배울 수 있는 최고의 길잡이가 될 것입니다. - 김현우 (Upstage AI 리서치 엔지니어) |
복잡한 개념도 명확하고 체계적으로 설명되어 있어, RAG의 개념을 처음 접하는 사람도 쉽게 이해할 수 있습니다. 실습 프로젝트는 실력을 한 단계 끌어올려줍니다. LangChain과 LangGraph를 활용한 실습 중심의 설명이 인상적입니다. 이론과 예제를 균형 있게 다루어 실무에 바로 활용 가능한 지식을 제공합니다. - 장다예 (Microsoft 엔지니어)
|
2000년대의 혁명이 인터넷이었다면, 2020년대의 혁명은 단연 LLM이라고 생각합니다. 이 책은 Langchain, RAG, MultiModal 등 기초적이면서도 실용적인 LLM 활용 예제로 가득차 있습니다. 앞으로도 무궁무진한 가능성을 가진 LLM의 시대에 이 책은 좋은 나침반이 될 것이라 믿습니다. - 지승훈 (NHN Cloud 개발자)
|