품목정보
발행일	2021년 06월 29일
이용안내 ?	배송 없이 구매 후 바로 읽기 이용기간 제한없음 TTS 가능 ('예스24 eBook' 모바일앱에서 사용 가능)? 저작권 보호를 위해 인쇄 기능 제공 안함
지원기기	크레마, PC(윈도우 - 4K 모니터 미지원), 아이폰, 아이패드, 안드로이드폰, 안드로이드패드, 전자책단말기(일부 기기 사용 불가), PC(Mac)
파일/용량	PDF(DRM) \| 49.93MB ?
글자 수/ 페이지 수	약 331쪽?
ISBN13	9791165920845

더보기

이 상품의 태그

#알파고 #딥러닝 #인공지능

기계는 어떻게 생각하는가?

12,000원 (0%)

'기계는 어떻게 생각하는가?' 상세페이지 이동

알파제로를 분석하며 배우는 인공지능

21,000원 (0%)

'알파제로를 분석하며 배우는 인공지능' 상세페이지 이동

패키지 없이 R로 구현하는 심층 강화학습

20,800원 (0%)

'패키지 없이 R로 구현하는 심층 강화학습' 상세페이지 이동

카드 뉴스로 보는 책

Chapter 0. R 언어 소개0.1 R 설치〉 0.1.1 Windows 버전 R 다운로드 〈〉 0.1.2 mac OS 버전 R 다운로드 〈 0.2 R 전용 통합 개발 환경(IDE) 설치Chapter 1. 머신러닝이란 Machine Learning1.1 머신러닝이 필요한 이유〉 1.1.1 머신러닝 학습시키기 〈〉 1.1.2 손실 함수 〈〉 1.1.3 머신러닝의 구분 〈1.2 딥러닝(Deep Learning)〉 1.2.1 딥러닝의 사례 〈Chapter 2. 딥러닝 Deep Learning2.1 퍼셉트론(Perceptron)2.2 Multi Layer Perceptron(MLP)〉 2.2.1 Feed Forward 〈〉 2.2.2 Back Propagation 〈〉 2.2.3 활성 함수(Activation Function) 〈〉 2.2.4 Gradient Descent Method 〈〉 2.2.5 Iteration & Batch Size 〈〉 2.2.6 딥러닝의 단점 및 극복 〈2.3 딥러닝(Deep Learning)〉 2.3.1 Universal Approximation Theorem 〈〉 2.3.2 Convolutional Neural Network(CNN) 〈〉 2.3.3 다양한 CNN 구조 〈〉 2.3.4 Recurrent Neural Network(RNN) 〈〉 2.3.5 다양한 RNN 구조 〈〉 2.3.6 GAN 학습 과정 - Feed Forward 〈〉 2.3.7 GAN 학습 과정 - Back Propagation 〈2.4 R로 구현하는 신경망〉 2.4.1 Feed Forward 〈〉 2.4.2 Back Propagation 〈Chapter 3. 강화학습 Reinforcement Learning3.1 강화학습 정의 요소 〉 3.1.1 상태(State) 〈〉 3.1.2 행동(Action) 〈〉 3.1.3 정책(Policy) 〈〉 3.1.4 보상(Reward) 〈〉 3.1.5 감가율과 감가 누적 보상(Discount factor and Return) 〈〉 3.1.6 상태 가치 함수(State Value Function) 〈〉 3.1.7 행동 가치 함수(Action Value Function) 〈〉 3.1.8 벨만 방정식(Bellman equation) 〈〉 3.1.9 몬테 카를로 학습(Monte-Carlo Learning, MC) 〈〉 3.1.10 시간 차 학습(Temporal Difference Learning, TD) 〈〉 3.1.11 정책 갱신 〈3.2 손으로 풀어보는 Q-LearningChapter 4. 심층 강화학습 Deep Reinforcement Learning4.1 Deep Q-Learning with Experience Replay(DQN)[예제 4-1] DQN으로 최적 경로 찾기4.2 Prioritized Experience Replay (PerDQN)[예제 4-2] PerDQN으로 최적 경로 찾기 4.3 Dueling DQN4.4 Policy Gradient(PG)〉 4.4.1 REINFORCE Algorithm 〈〉 4.4.2 Actor-Critic 〈4.5 Advantage Actor-Critic(A2C)[예제 4-3] A2C로 최적 경로 찾기4.6 Asynchronous Methods for Deep Reinforcement Learning(A3C)4.7 강화학습의 발전 방향〉 4.7.1 다수의 에이전트(Multi Agent) 〈〉 4.7.2 희소 보상 문제(Sparse Reward Problem) 〈4.8 Curiosity〉 4.8.1 Exploration Bonus 〈〉 4.8.2 Count-Based Exploration Bonus 〈〉 4.8.3 Curiosity의 개념 〈4.9 Self-Imitation Learning [예제 4-4] SIL로 최적 경로 찾기(난이도 3)4.10 Exploration by Random Network Distillation[예제 4-5] RND로 최적 경로 찾기(난이도 3) Chapter 5. 심층 강화학습을 이용한 프로젝트 5.1 1단계 프로젝트〉 5.1.1 Environment 소개 〈〉 5.1.2 State 설계 〈〉 5.1.3 Reward 설계 〈〉 5.1.4 1단계 프로젝트 학습 코드 〈5.2 2단계 프로젝트 〉 5.2.1 Environment 소개 〈〉 5.2.2 State 설계 〈〉 5.2.3 Reward 설계 〈〉 5.2.4 2단계 프로젝트 학습 코드 〈5.3 3단계 프로젝트〉 5.3.1 Environment 소개 〈〉 5.3.2 3단계 프로젝트 학습 코드 〈Chapter 6. 최신 강화학습 트렌드6.1 Trust Region Policy Optimization(TRPO) 6.2 Proximal Policy Optimization(PPO) 6.3 Distributed Prioritized Experience Replay(Ape-X)6.4 Never Give Up(NGU)6.5 Rewarding Impact-Driven Exploration (RIDE)6.6 BeBold〉 6.6.1 Episodic Restriction on Intrinsic Reward(ERIR) 〈6.7 Surprise Minimizing Reinforcement Learning(SMiRL)그림 출처찾아보기

더보기

저자 소개 (3명)

출판사 리뷰 출판사 리뷰 보이기/감추기

베타 리더 추천사대부분의 실용성을 목적으로 한 딥러닝 책과는 현저히 다른 차별점을 보입니다. 코딩 중심으로 풀어나가야 하는 내용을 코딩만으로 풀어나가거나 이론에 대한 설명이 부족한 책이 많은 데에 비해, 이 책은 적절한 예시와 설명과 함께 제일 중요한 수리적 기반 및 매커니즘을 제시합니다. 특히 코드에서 각 부분마다 #(n)로 친절한 분석을 제공하고 있어, 코딩 자체의 구조가 헷갈리거나 처음 보는 구문이 있더라도 쉽게 이해할 수 있을 것입니다. 패키지 설치 없이 온전히 R의 기본 언어들로 구조를 만들었기 때문에 기초를 탄탄히 다질 수 있고, 근본적인 로직에 대한 이해력도 올라가는 느낌입니다._ 김한영 (데이터 사이언티스트)시중에 R 과 관련된 책들은 대부분 전통적인 통계학이나 데이터 분석을 주로 다루는 반면 강화학습을 다루는 책들은 대부분 파이썬으로 코드를 제시합니다. 통계 및 시뮬레이션이 핵심인 강화학습 알고리즘을 R로 구현하는 책은 그간 없었는데, 그러한 갈증을 해소할 만한 좋은 책입니다. 책의 전반적인 서술은 흠잡을 곳이 없고 입문자도 쉽게 이해할 수 있게 잘 설명되어 있습니다. 단순히 개념 설명과 수식전개에서 그치지 않고, 실제 손으로도 계산해볼 수도 있을 만큼 간단한 예제를 제시하여 확실하게 개념을 이해할 수 있습니다. 다루기 다소 방대한 주제에도 불구하고 읽기 부담스럽지 않게 300페이지 내외로 서술되어 있으며, 패키지에 의존하지 않고 R 내장 함수로만 구현되어 있으므로 다소 응용만 한다면 다른 언어로도 손쉽게 포팅도 가능할 것 같습니다._ 원동식 (대학원생)R을 이용하여 머신러닝과 딥러닝의 기초부터 충분히 설명하고 있어 초심자나 중급자 모두가 이해할 수 있습니다. 특히 R을 이용해 강화학습을 설명하는 책은 별로 없었는데 이 책은 그 점에서도 큰 가치가 있다고 생각합니다._ 송진영 (데이터 분석가)R을 활용하여 밑바닥부터 강화학습을 구현하는 책입니다. R은 Python 같은 범용 언어에 비해 유연성은 부족하지만 군더더기를 걷어낸 핵심 로직에 집중할 수 있어, 강화학습과 같은 난이도 높은 알고리즘을 연습하기에 제격이라 생각합니다. 이 책은 Q-learning을 직접 손으로 풀어보고 Grid World를 활용하여 3단계 심층 강화학습 실습을 거치는 구성이 인상적이었는데, 특히 강화학습과 관련된 주요 논문들의 핵심 분석 과정이 백미입니다. 책 말미에는 TRPO, SMiRL와 같은 최신 주제도 다룹니다. 강화학습은 그 자체로도 난이도가 상당하며, 이 책에서는 수식을 정면 돌파하기 때문에 입문자보다는 딥러닝에 익숙한 분들께 추천해 드리고 싶습니다._ 허민 (데이터 분석가)

회원리뷰 (3건) 회원리뷰 이동

리뷰 쓰기

혜택 및 유의사항?

총 평점 10.0점 10.0 / 10.0

검색결과 정렬 옵션 삭제

회원리뷰 전체보기

한줄평 (0건) 한줄평 이동

한줄평 쓰기

혜택 및 유의사항?

등록된 한줄평이 없습니다!

첫번째 한줄평을 남겨주세요.

배송/반품/교환 안내

배송 안내

반품/교환 안내에 대한 내용입니다.
배송 구분	구매후 즉시 다운로드 가능 배송비 : 무료배송

반품/교환 안내

상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내에 대한 내용입니다.
반품/교환 방법	고객만족센터(1544-3800), 중고샵(1566-4295) 판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간	출고 완료 후 10일 이내의 주문 상품 디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품 중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용	고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임 직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음 단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제 오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소 오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소 직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음 단, 당일 00시~13시 사이의 주문은 취소 수수료 면제 박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유	소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등 복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우 eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가 중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우 LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상	상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에 따른 배상	대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리