이 책은 최신 언어 모델의 핵심 기술과 실제 활용 방법을 체계적으로 잘 설명하고 있습니다. LLM 모델의 기초부터 트랜스포머 아키텍처, BERT, GPT, T5 등 다양한 모델에 대한 상세한 설명을 제공하며, 허깅페이스 트랜스포머 라이브러리를 활용한 실제 코드 예제를 통해 쉽게 이해할 수 있도록 돕습니다.
특히 LLM 관련 기술의 이론적 배경과 최적화를 위한 다양한 방법론을 알기 쉽게 설명하며, LLM 애플리케이션의 핵심인 RAG 구현에 대한 상세한 내용을 포함하고 있습니다. LLM과 RAG의 통합적 이해를 원하는 독자들에게 최고의 선택이 될 것입니다.
- 강재원 (여기어때컴퍼니 DNA센터 비즈니스 인사이트팀 팀장)
“대규모 언어 모델의 기초부터 실무 적용까지 한 권에 담은 완벽한 지침서”
이 책은 대규모 언어 모델(LLM)의 이론과 실무를 깊이 있게 다룹니다. 저자는 『파이토치 라이트닝으로 시작하는 딥러닝』 등 권위 있는 서적을 번역하고 수많은 강의와 논문을 연구한 딥러닝과 LLM 분야의 전문가입니다. 그의 풍부한 실무 경험과 창의적인 문제해결 능력은 자연어 처리 기술을 비자연어 및 비전통적 문제에 적용하는 독창적인 접근방식을 제시했으며, 이는 동료들에게 깊은 인상과 영감을 주었습니다.
딥러닝과 언어 모델을 포함한 자연어 기술은 꾸준히 발전해 왔지만, 챗GPT의 출현은 ‘아이폰 모멘트(iPhone Moment)’에 비유될 정도로 기술의 대중화와 삶에 혁신적 변화를 촉진하고 있습니다. 누구나 손쉽게 도구를 활용하여 기술에 접근할 수 있게 되었지만, 급변하는 환경에서 기초 개념과 기술 원리에 대한 심도 있는 이해는 여전히 필수적입니다.
이 책은 복잡한 개념을 직관적으로 설명하며, 시각 자료와 실용적인 코드 예제를 제공하여 초보자부터 전문가까지 쉽게 이해하고 활용할 수 있습니다. 또한 현업의 문제들과 최신 기술 트렌드를 포괄적으로 다루어 실무 적용에 최적화되어 있습니다.
LLM의 기초를 배우고자 하는 입문자, 최신 기술을 실무에 적용하려는 개발자, 다양한 이해관계자에게 기술을 설명하려는 전문가 및 교육자 등 기술의 본질을 이해하고 창의적인 문제 해결 능력을 키우고자 하는 모든 이에게 유용한 지침서가 될 것입니다.
- 김경문 ((주)크몽 데이터팀 리드)
2024년 가장 뜨거운 키워드는 LLM과 생성형 AI이며, 이제 LLM은 주요한 IT 인프라스트럭처로 인식되고 있습니다. 기술이 발전하면서 LLM은 데이터 과학자의 전유물이 아닌 LLM 개발자, LLM 운영자, LLM 애플리케이션 개발자 등 다양한 영역에서 활용을 고민하는 키워드가 됐습니다. LLM을 활용하는 분야가 늘어나면서 LLM을 단순히 블랙박스가 아닌 기술이나 아키텍처로서 이해해야 하는 직군이 늘어가고 있습니다. 그러나 트랜스포머 기반의 LLM을 학습하기 위한 시작점을 찾기란 여전히 어려운 것이 사실입니다. 머신러닝, 딥러닝, RNN으로 시작해서 LLM까지 이해하기에는 그 여정이 너무 험난합니다.
이 책은 LLM을 깊이 있게 이해하고 싶은 분들에게 전체적인 개념과 흐름, 개념, 작업 개요를 그저 학문의 용어가 아닌 ‘실무의 용어’로 설명하는 책입니다. 현업 실무자, 그리고 신규 입문자를 위해 이론과 수식이 가득한 공간을 친숙한 용어로 풀이해 기나긴 LLM 여정을 완주할 수 있도록 돕는 것이 이 책의 장점이라고 생각합니다. LLM 인프라스트럭처를 대중화하는 실무서로서 현업에서 LLM을 활용해야 하는 분들과 새롭게 입문하시는 분들에게 강력히 추천합니다. 결코 쉽지 않은 학문 지식을 실무 정보로 흥미롭게 풀어내 주신 저자의 노력에 감사드립니다.
- 김태완 (한국오라클 상무)
LLM 기술이 빠르게 발전하는 가운데, 안타깝게도 관련 서적들은 그 속도를 따라잡지 못했다. 최신 기술은 주로 논문이나 영문 블로그를 통해 접할 수밖에 없었고 이는 책을 사랑하는 독자로서 아쉬운 일이었다. 그러나 이제 그 갈증을 해소할 수 있게 되었다.
이 책은 LLM 관련 최신 기술을 총망라할 뿐만 아니라, 영문으로도 접하기 힘든 고급정보를 우리말로 쉽게 설명해 준다. 특히 4장 ‘말 잘 듣는 모델 만들기’는 실제 챗GPT와 같은 언어 모델을 구축하는 과정을 가상의 코딩 테스트 서비스 개발에 빗대어 명쾌하고 흥미롭게 설명한다. 사전 학습, 미세 조정, 채점 모델, 강화 학습까지 전 과정을 단계별로 상세히 다루어 챗GPT의 개발 원리를 누구나 쉽게 이해할 수 있게 해준다. 더불어 정진호 작가가 직접 그린 친절한 일러스트는 복잡한 LLM의 구축 과정과 동작 원리를 시각적으로 이해하는 데 큰 도움을 준다. 이 외에도 이 책은 LLM 관련 아키텍처, 라이브러리, 최적화 기법 등 연구자와 개발자에게 필수적인 고급 정보로 가득하다.
이제 LLM은 모든 개발자에게 있어 선택이 아닌 필수 지식으로 자리 잡고 있다. 『LLM을 활용한 실전 AI 애플리케이션 개발』은 이러한 필수 핵심 지식을 쌓는 데 최적의 안내서가 될 것이다. LLM 분야에 관심 있는 독자에게, 나아가 AI와 소프트웨어 개발의 미래를 준비하는 모든 독자에게 이 책을 강력히 추천하는 바이다.
- 박상길 (디노티시아 LLM 연구개발, 전 현대자동차 인공지능 테크리드, 『자바 알고리즘 인터뷰』 저자)
이 책을 읽으면서, 2010년 초반에 딥러닝을 처음 접했을 때 이처럼 좋은 책이 있었다면 얼마나 좋았을까라는 생각을 했습니다. 당시 한글로 된 자료는 턱없이 부족했고, 논문의 복잡한 수식은 현장의 엔지니어가 이해하기에 어려웠습니다. 인터넷의 자료는 도구를 설명하는 데 그쳐서 핵심적인 개념을 습득하고 응용하는 데 많은 시간을 들여야 했습니다.
이 책은 챗GPT로 대표되는 LLM의 시대에 그때와 비슷한, LLM에 대한 갈증을 완벽하게 해소해 줍니다. 저자는 LLM에 대한 전문적인 이해를 바탕으로, 복잡한 개념을 어려운 수식 없이 누구나 이해할 수 있도록 쉽게 설명합니다. 또한 LLM의 핵심요소를 직접 구현해 보며 개념을 체득할 수 있도록 친절히 안내합니다. 그리고 당장 제품에 적용할 수 있을 정도로 높은 수준의 응용 사례를 제공합니다.
LLM의 기본 개념을 이해하고 싶거나, LLM 애플리케이션을 효과적으로 개발해야 하거나, 이미 구축한 LLM 시스템을 운영하면서 최적화가 필요한 모든 분들에게 이 책을 추천합니다.
- 송준이 ((주)크몽 CTO)
이 책은 언어 모델의 기초부터 최신 기술 동향, 애플리케이션 개발 및 운영, 실전 개발 과정에서의 유의점까지, LLM에 대한 거의 모든 것을 담고 있는 백과사전 같은 가이드다. 많은 내용을 다룰 뿐 아니라 트랜스포머 아키텍처의 작동 원리, 파인 튜닝 등 LLM의 핵심 기반 기술을 자세하고 친절하게 소개하고 있어, 독자들이 LLM 기술에 대한 통찰력을 가질 수 있도록 도움을 준다. 이론적인 설명에 더해 실습 예제 코드로도 설명 내용을 보완하고 있기에 훨씬 이해가 잘되는 것도 이 책의 장점이다.
핵심 내용뿐만 아니라 sLLM, RAG, 멀티 모달, LLM 에이전트 등 LLM 분야의 최신 기술까지 다루므로 LLM에 대해 체계적이고 종합적으로 공부해 보고 싶다면 이 책이 좋은 교과서가 될 수 있을 것이다.
- 최재원 (아주대학교 교수학습개발센터 학습데이터 분석 및 AI교육 담당 연구원)
이 책은 출간된 현재 시점에서 대규모 언어 모델에 대해 우리가 알아야 할 거의 모든 부분을 다룬다. 만약 신경망 유닛이나 역전파와 정규화나 텐서 연산 등 기초적인 인공지능 개념에 대해 파악했고 파이토치 등을 통해 기본적인 학습과 추론을 사용해 본 독자라면 이제 이 책의 내용을 소화할 차례다. AI 분야의 인재가 부족한 상황에서 이렇게 자세하고 친절하게 그리고 최신 내용을 모두 포함해 언어 모델을 설명한 도서라니 목차부터 매력적이지 않을 수 없다.
이 책은 순환신경망, 어텐션, 트랜스포머, BERT, 임베딩, 파인 튜닝과 RLHF 그리고 LoRA 등의 생성형 AI 학습의 역사와 모델 훈련과 추론에 대한 세세한 내용을 자세히 다룬다. 동시에, 반향을 일으켰던 여러 논문들도 소개하며 실제 모델 훈련 예제까지 알려준다. 모델을 연구 개발하면서 참조하게 될 허깅페이스와 깃허브의 여러 유용한 데이터와 라이브러리까지 소개하고 있으니, 본격적으로 LLM에 발을 들여놓은 분이나 이미 알고 있더라도 관련 지식을 한번 정리하고 싶은 사람에게 많은 도움이 될 것으로 보인다. 실제 훈련 과정에서 GPU를 효율적으로 활용하는 방법에 대한 내용까지 다루며, 만들어진 모델이 최신 지식을 참조해 답을 할 수 있도록 RAG를 적용하는 방법과 에이전트로 만들어진 모델의 평가와 트랜스포머 이후의 아키텍처 등 이 분야의 향후 발전 방향까지도 가늠할 수 있도록 충실하게 채운 저자의 노력이 독자에게 큰 배움을 선사하며 빛을 발하리라 기대한다.
- 현동석 (네이버 서치 데이터 리더)
LLM(대규모 언어 모델) 인공지능 기술은 그 복잡성과 눈부신 발전 속도로 인해 종합적으로 파악하기 매우 어려운 분야입니다. 이러한 상황에서 이 책을 접하게 된 것은 저에게도 큰 기쁨이었습니다.
저자는 먼저 LLM 기술의 전체적인 큰 그림을 명쾌하게 제시한 후, 각 요소 기술을 깊이 있게 다룹니다. 또한 각 기술이 본질적으로 복잡해서 스스로 이해하거나 남에게 설명해 주기가 꽤 어려움에도 불구하고, 독자들을 배려하여 최대한 쉽게 설명합니다. 이러한 접근 방식 덕분에 저 또한 각 기술을 이해하는 데 큰 도움을 받았습니다.
급변하는 LLM 기술 분야에서 이 책은 포괄적이면서도 깊이 있는 이해를 제공하기에, 이 분야에 대한 체계적인 지식을 갖추고자 하는 이에게 훌륭한 길잡이가 될 것입니다. AI와 LLM 기술에 관심 있는 독자들에게 이 책을 진심으로 추천합니다.
- 잔재미코딩 데이브 리(Dave Lee) (노이먼스 & 튜링스 CTO)
허정준님의 책은 LLM의 중추가 되는 트랜스포머 아키텍처부터 오픈소스 LLM의 활용과 미세 조정, 라마인덱스를 활용한 RAG 구현과 개선, 멀티모달 LLM과 에이전트까지 폭넓은 주제를 알차게 구성해 다루고 있습니다. 주요 핵심 개념들을 이해하기 쉽게 정리하고 실무자들이 손쉽게 따라할 수 있게 한 점이 특히 인상적이었습니다.
실무에 유용한 RAG 프로젝트 실습과 MLOps, LLMOps에 대한 소개는 이 책의 큰 강점으로, 실무에 바로 적용할 수 있는 지식을 제공합니다. LLM에 입문하고자 하는 사회 초년생과 현업 개발자 모두에게 강력히 추천합니다.
- 송호연 (Contxts.io (NFTBank) VP of AIOps)