이미 소장하고 있다면 판매해 보세요.
프롤로그
추천사 독자들의 찬사 코드 리뷰어들의 후기 다운로드 및 문의 이 책의 구성 PART 01 처음 만나는 LangChain CHAPTER 01 RAG 이해하기 01 RAG를 사용해야 하는 이유 02 RAG의 기막힌 능력 03 LangChain을 이용한 RAG 시스템 구축 CHAPTER 02 환경 설정 01 윈도우에서 환경 설치 02 MacOS에서 환경 설치 03 OpenAI API 키 발급 및 설정하기 04 LangSmith 키 발급 및 설정하기 CHAPTER 03 LLM 기본 용어 01 Jupyter Notebook 사용법 02 토큰, 토큰 계산기, 모델별 토큰 비용 03 모델의 입출력과 컨텍스트 윈도우 CHAPTER 04 LangChain 시작하기 01 ChatOpenAI 주요 매개변수와 출력 02 LangSmith로 GPT 추론 내용 추적하기 03 멀티모달 모델로 이미지를 인식하여 답변 출력하기 04 프롬프트 템플릿 활용하기 05 LCEL로 체인 생성하기 06 출력 파서를 체인에 연결하기 07 batch() 함수로 일괄 처리하기 08 비동기 호출 방법 09 Runnable로 병렬 체인 구성하기 10 값을 전달해 주는 RunnablePassthrough 11 병렬로 Runnable을 실행하는 RunnableParallel 12 함수를 실행하는 RunnableLambda와 itemgetter PART 02 프롬프트와 출력 파서 CHAPTER 05 프롬프트 01 프롬프트 템플릿 만들기 02 부분 변수 활용하기 03 YAML 파일로부터 프롬프트 템플릿 로드하기 04 ChatPromptTemplate 05 MessagesPlaceholder 06 퓨샷 프롬프트 07 예제 선택기 08 FewShotChatMessagePromptTemplate 09 목적에 맞는 예제 선택기 10 LangChain Hub에서 프롬프트 공유하기 CHAPTER 06 출력 파서 01 PydanticOutputParser 02 with_structured_output() 바인딩 03 LangSmith에서 출력 파서의 흐름 확인하기 04 쉼표로 구분된 리스트 출력 파서 05 구조화된 출력 파서 06 JSON 형식 출력 파서 07 Pandas 데이터프레임 출력 파서 08 날짜 형식 출력 파서 09 열거형 출력 파서 PART 03 모델과 메모리 CHAPTER 07 모델 01 RAG에서 LLM의 역할과 모델의 종류 02 다양한 LLM 활용 방법과 API 키 가져오기 03 LLM 답변 캐싱하기 04 직렬화와 역직렬화로 모델 저장 및 로드하기 05 GPT 모델의 토큰 사용량 확인하기 06 Google Generative AI 모델 07 Hugging Face Inference API 활용하기 08 Dedicated Inference Endpoint로 원격 호스팅하기 09 Hugging Face 로컬 모델 다운로드 받아 추론하기 10 Ollama 설치 및 Modelfile 설정하기 11 Ollama 모델 생성하고 ChatOllama 활용하기 12 GPT4All로 로컬 모델 실행하기 CHAPTER 08 메모리 01 대화 버퍼 메모리 02 대화 버퍼 윈도우 메모리 03 대화 토큰 버퍼 메모리 04 대화 엔티티 메모리 05 대화 지식 그래프 메모리 06 대화 요약 메모리 07 벡터 스토어 검색 메모리 08 LCEL 체인에 메모리 추가하기 09 SQLite에 대화 내용 저장하기 10 휘발성 메모리로 일반 변수에 대화 내용 저장하기 PART 04 데이터 로드와 텍스트 분할 CHAPTER 09 문서 로더 01 문서 로더의 구조 이해하기 02 PDF 로더 03 HWP 로더 04 CSV 로더와 데이터프레임 로더 05 WebBaseLoader 06 DirectoryLoader 07 UpstageDocumentParseLoader 08 LlamaParse CHAPTER 10 텍스트 분할 01 문자 단위로 분할하기 02 문자 단위로 재귀적으로 분할하기 03 토큰 단위로 분할하기 04 의미 단위로 분할하기 05 코드 분할하기 06 마크다운 헤더로 분할하기 07 HTML 헤더로 분할하기 08 JSON 단위로 분할하기 PART 05 벡터 스토어와 리트리버 CHAPTER 11 임베딩 01 OpenAIEmbeddings 02 CacheBackedEmbeddings 03 HuggingFaceEmbeddings 04 UpstageEmbeddings 05 OllamaEmbeddings CHAPTER 12 벡터 스토어 01 Chroma 02 FAISS 03 Pinecone CHAPTER 13 리트리버 01 벡터 스토어 기반 리트리버 02 문서 압축기 03 양방향 리트리버 04 긴 문맥 재정렬 05 부모 문서 리트리버 06 다중 쿼리 생성 리트리버 07 다중 벡터 스토어 리트리버 08 셀프 쿼리 리트리버 09 시간 가중 벡터 스토어 리트리버 PART 06 LangChain 실습 CHAPTER 14 Streamlit으로 ChatGPT 웹 앱 제작하기 01 기본적인 웹 앱 형태 만들기 02 웹 앱에 체인 생성하기 03 프롬프트 타입 선택 기능 추가하기 CHAPTER 15 이메일 업무 자동화 챗봇 01 이메일 내용으로부터 구조화된 정보 추출하기 02 SerpAPI를 정보 검색에 활용하기 03 구조화된 답변을 다음 체인의 입력으로 추가하기 04 이메일의 주요 정보 및 검색 정보 기반 요약 보고서 챗봇 CHAPTER 16 다양한 모델을 활용한 챗봇 01 별도의 파이썬 파일로 기능 분리하기 02 GPT 대신 Deepseek 모델 사용하기 03 Ollama 모델을 사용한 RAG 04 멀티모달 모델을 활용한 이미지 인식 기반 챗봇 CHAPTER 17 RAG 챗봇 01 PDF 문서 기반 질의응답 RAG 만들기 02 프롬프트를 개선해 주는 프롬프트 메이커 03 페이지 분할 후 파일 업로드 기능 추가하기 04 PDF 기반 QA 챗봇 만들기 05 LangSmith 추적, 다양한 LLM을 RAG에 적용하기 06 프롬프트에 출처 표시하고 표 기능 추가하기 에필로그 찾아보기 |
테디노트
이경록의 다른 상품
“서울특별시에 사는 테디 아버지 이름이 뭐야?”
ChatGPT는 이러한 개인적인 질문을 받으면 굉장히 황당할 겁니다. 테디가 누구인지, 그의 아버지 이름이 뭔지 어떻게 알겠냐고요. 이런 경우 모른다고 답하거나 답변하는 과정에서 잘못된 정보를 생성(할루시네이션)할 가능성이 높습니다. 하지만 다음과 같은 가족관계증명서를 GPT에게 주면 어떻게 될까요? GPT는 자료를 참고해서 테디 아버지 이름은 ‘폴’이라고 정확한 답변을 제공할 수 있을 것입니다. --- p.25 완전 파인 튜닝은 다소 전문적인 영역이기 때문에 개인이 수행하기에는 어려울 수 있습니다. PEFT 역시 파인 튜닝의 한 종류이지만, 충분한 시간과 노력을 들인다면 개인적으로 시도해 볼 수 있는 수준입니다. RAG는 코드 작성이 필요 없는 프롬프트 엔지니어링과 비교해도 구현 난이도가 그리 높지 않은데, 앞으로 학습할 8단계의 세부 모듈을 플러그인처럼 교체하는 방식으로 구현할 수 있기 때문입니다. --- p.29 ChatGPT는 자체 RAG 시스템을 통해 답변을 제공하지만, 더 나은 답변을 위해 세부 알고리즘을 조정할 수 없다는 문제가 있습니다. 이제 우리는 LangChain을 통해 RAG의 모든 세부 프로세스를 한 땀 한 땀 구현할 것입니다. 한마디로 ‘튜닝’을 하는 것이죠. 우리가 원하는 형태의 답변을 얻을 때까지 각 과정을 투명하게 개선하고, 그 방법론을 체계적으로 정립해 놓으면 다양한 비즈니스 환경에서도 얼마든지 활용 가능한 수준의 성능에 도달할 수 있습니다. --- p.33 가령 ‘인공지능 산업의 최신 동향’이라는 23페이지 분량의 보고서 PDF 파일을 업로드했다고 가정해 보겠습니다. 만약 프롬프트에서 이 파일의 모든 정보를 한 번에 참고한다면, 사용자가 질문을 할 때마다 23페이지나 되는 내용이 모두 프롬프트 입력으로 들어가 버립니다. 그러면 질문을 처리하는 비용이 비싸지기도 하거니와 GPT에 너무 많은 정보를 제공한 탓에 중요한 정보를 찾지 못할 수도 있습니다. 그래서 업로드한 정보에서 관련성 있는 정보만 골라서 리트리버(retriever, 검색기)에 전달하는 것이 효율적입니다. 이 과정이 RAG 프로세스의 사전 단계에 해당합니다. --- p.34 LangChain과 RAG 관련 실습 코드는 지속적으로 업데이트되고 있습니다. LangChain의 빈번한 업데이트로 인해 기존 코드들이 레거시(더 이상 지원되지 않거나 지원이 종료된 코드)가 되는 경우가 많아, 패키지 업데이트 후에는 실행되지 않을 수 있습니다. 또한 LangChain이 지원하는 다양한 모델들도 업데이트에 따라 지원이 중단되거나, 새로운 모델이 아직 반영되지 않은 경우도 많습니다. 이에 대응하기 위해 이 책에서는 코드 변경을 추적하고 버전을 관리해 주는 시스템인 깃을 설치하여 항상 최신 코드로 실습할 수 있도록 하겠습니다. --- p.43 |
★ 8단계로 정리한 RAG 파이프라인을 손에 익히는 완성형 학습 과정
LLM과 RAG의 기본 개념을 이해하고, LangChain의 기본 사용법과 LCEL 체인 구성 문법을 익히는 체계적인 과정으로 이뤄져 있다. RAG 파이프라인 8단계(문서 로드 → 텍스트 분할 → 임베딩 → 벡터 저장 → 리트리버 검색 → 프롬프트 생성 → LLM 응답 생성 → 체인 구성)를 하나하나 실습하며, 각 단계에서 활용할 수 있는 다양한 모듈과 도구(PDF 로더, 여러 종류의 텍스트 분할기, OpenAI 및 Hugging Face 임베딩, 다양한 벡터 데이터베이스, 고급 리트리버 등)를 익힌다. 이 과정에서 선택 가능한 옵션과 특성, 차이점을 비교해 가며 기본기를 탄탄히 다진다. ★ 다양한 모델을 짧게, 빠르게, 반복해서 실전 감각 완성 책 전반에 걸쳐 LLM 모델(OpenAI, Hugging Face, Upstage, Ollama 등), 문서 로더(PDF, HWP, CSV, 웹 데이터), 텍스트 분할기, 벡터 스토어(Chroma, FAISS, Pinecone), 리트리버, 메모리 시스템 구축 과정을 반복해서 실습한다. 각 기능별로 짧은 코드 예제와 실행 결과를 통해 자연스럽게 손에 익히게 하며, 다양한 선택지를 실습하고 비교함으로써 자신의 프로젝트 목적에 맞는 최적의 모델과 기능을 빠르게 고를 수 있는 실전 감각을 기른다. 또한 최신 논문의 기술도 소개하며 실습에 직접 적용해 볼 수 있다. ★ 상황별 챗봇 프로젝트로 배우는 실전형 RAG 시스템 구축 Streamlit 프레임워크를 활용하여 다양한 상황별 RAG 프로젝트를 직접 만든다. 문서 기반 질문 응답 챗봇, 이메일 업무 자동화 챗봇, 멀티모달 입력을 지원하는 이미지 기반 챗봇, 다양한 오픈소스 모델을 조합한 고급 RAG 챗봇 등 실전 사례를 직접 구현해 본다. ▶코드 리뷰어들의 후기 “실습 중심으로 개념 학습은 물론, 실제 프로젝트에 곧바로 적용할 수 있는 실전형 가이드입니다. 특히 LangSmith와 같은 최신 도구까지 반영되어 있어 그 가치는 더 큽니다.” _전창원_ LG CNS “전공자가 아닌 제가 감히 리뷰를 해도 될지 고민했지만, 저와 비슷하게 다른 분야의 업무를 하면서 AI 분야 필요성을 느껴 배움을 시작하는 독자들에게 조금이라도 도움이 되고자 하는 마음으로 진행했습니다. 실습 중심의 구성과 친절한 설명 덕분에 누구든 부담 없이 시작할 수 있을 것입니다.” _김무상_ 삼성전자 “『테디노트의 랭체인을 활용한 RAG 비법노트』는 LLM을 뛰어놀게 하는 아름다운 코드입니다. 리뷰를 거듭할수록 저자의 피와 땀이 얼마나 이 코드에 스며들었는지 느낄 수 있었습니다.” _김정욱_ 브레인크루 ▶이 책에 쏟아진 찬사 “시작이 어려웠던 모두에게 최고의 선택이 될 것입니다.” _김재호_수원대학교 대학원 컴퓨터학과 “독보적 한국형 예시로 이해가 쏙쏙 되었고 빠르게 성장할 수 있었습니다.” _박정기_JCH SYSTEMS / AI 선임 연구원 / n8n Korea 앰버서더 “복잡한 설명 없이 step by step 따라하기로! 정말 매력적입니다. 사실입니다.” _신정호_입소스코리아 / 데이터사이언스 “책이 아니라 나침반을 사는 겁니다.” _오주영_프리랜서 “LangChain 입문에 있어서 바이블 같은 책” _정광원_주식회사 스튜디오엠 개발팀 팀장 “더 이상 랭체인이 무엇인지, 어떻게 개발해야 하는지 찾지 않게 되었습니다.” _조영준_에스티이지 “코드를 따라 가다 보니 어느새 랭체인 마스터가 되었습니다.” _허수영_윈드케어 ▶이 책이 필요한 독자 RAG 기본 개념부터 실제 구현까지 체계적으로 배우고자 하는 입문자들 랭체인 프레임워크를 활용하여 RAG 시스템을 구축하려는 개발자들 LLM의 한계를 극복하고 정확한 정보 검색과 응답 생성을 결합하려는 데이터 전문가들 기업이나 조직에서 문서 검색, 이메일 자동화, 보고서 작성 등 실제 업무를 AI에 적용하려는 실무자들 기초적인 파이썬 실력을 가진 비개발자지만 AI에 관심있는 사람들 ▶ 이 책에서 다루는 내용 _PART 01 처음 만나는 LangChain RAG의 기본 개념과 필요성을 이해하고, 환경 설정 방법, LLM 기본 용어, LangChain의 핵심 기능과 LCEL 문법을 학습한다. ChatOpenAI 설정, 멀티모달 모델, 체인 구성 등 LangChain의 기초를 다룬다. _PART 02 프롬프트와 출력 파서 프롬프트 템플릿 생성, 부분 변수 활용, 퓨샷 프롬프트, 예제 선택기 등 다양한 프롬프트 기법과 PydanticOutputParser, JSON 파서, 데이터프레임 파서 등 출력 형식을 제어하는 방법을 배운다. _PART 03 모델과 메모리 다양한 LLM 모델(OpenAI, Google, Hugging Face, Ollama 등) 활용법과 대화 버퍼, 토큰 버퍼, 요약 메모리, 벡터 스토어 검색 메모리 등 대화 내용을 기억하는 메모리 시스템 구축법을 다룬다. _PART 04 데이터 로드와 텍스트 분할 PDF, HWP, CSV 등 다양한 문서 로더와 문자 단위, 토큰 단위, 의미 단위, 코드, 마크다운, HTML, JSON 등 다양한 방식의 텍스트 분할 방법을 학습한다. _PART 05 벡터 스토어와 리트리버 OpenAI, HuggingFace 등 임베딩 모델과 Chroma, FAISS, Pinecone 등 벡터 스토어, 다양한 리트리버(문서 압축기, 앙상블, 다중 쿼리 생성, 셀프 쿼리 등) 활용법을 배운다. _PART 06 LangChain 실습 Streamlit으로 ChatGPT 웹 앱, 이메일 자동화 챗봇, 다양한 모델 활용 챗봇, PDF 기반 RAG 챗봇 등 실제 프로젝트를 구현하며 앞서 배운 기술을 종합적으로 적용한다. |
“LangChain의 알파이자 오메가입니다. 이 시리즈로 배웠다면 더 배울 것이 없다고 할 정도로 상세히 많은 내용을 다루고 있습니다. 취업을 준비하든, 기업에서 AI 구현을 시작하든, AI의 실체를 알고 싶은 모든 분들에게 이 책을 권합니다. - 장동인 ( KAIST 김재철 AI 대학원 책임교수 및 AIBB LAB 대표)
|
이 책은 ‘생존 키트’입니다. 특히 LangChain을 기반으로 한 RAG 전략과 현장 중심의 팁들은 빠르게 변화하는 개념을 단시간에 체득할 수 있을 뿐 아니라 바로 현업에서 실질적인 성과를 얻을 수 있습니다. 저자의 시간과 노하우를 오롯이 담아낸 이 노트를 너무 쉽게 얻게 되어 미안한 마음까지 듭니다. - 강수진 (더 프롬프트 컴퍼니 대표)
|