이미 소장하고 있다면 판매해 보세요.
· 01장: 강화학습이란 무엇인가?
1.1 머신러닝의 유형(지도학습, 비지도학습, 강화학습) __용어 정리 __지도학습, 비지도학습, 강화학습 1.2 강화학습 및 심층강화학습의 역사 __강화학습과 뇌에서 일어나는 학습 __강화학습과 딥러닝의 결합 1.3 심층강화학습의 응용 사례 __심층강화학습의 응용 사례 __심층강화학습의 미래 · 02장: 미로찾기를 위한 강화학습 구현 2.1 주피터 노트북 체험 페이지 사용법 __이번 장에서 사용할 강화학습 구현 및 실행 환경 __주피터 노트북 체험 페이지 사용법 2.2 미로와 에이전트 구현 __미로 구현 __에이전트 구현 2.3 정책반복 구현 __정책반복과 가치반복 __정책경사 알고리즘에 따라 에이전트 이동시키기 __정책경사 알고리즘으로 정책 수정 __정책경사 알고리즘에 대한 이론 __보상 2.4 가치반복 알고리즘 관련 용어 정리 __행동가치와 상태가치 __벨만 방정식과 마르코프 결정 프로세스 __ε-greedy 알고리즘으로 정책 구현하기 2.5 Sarsa 알고리즘 구현 __행동가치 함수 Q(s,a)를 Sarsa 알고리즘으로 수정 __Sarsa로 미로찾기 구현 __Q러닝의 알고리즘 __Q러닝 구현 2.6 Q러닝 구현 · 03장: 역진자 문제를 위한 강화학습 구현 3.1 로컬 PC에 강화학습 개발환경 갖추기 __파이썬 실행 환경인 아나콘다 설치 __강화학습에 사용할 라이브러리 설치 3.2 역진자 태스크 “CartPole” __CartPole이란? __CartPole 구현 3.3 다변수, 연속값 상태를 표형식으로 나타내기 __CartPole의 상태 __상태의 이산변수 변환 구현 3.4 Q러닝 구현 · 04장: 파이토치를 이용한 딥러닝 구현 4.1 신경망과 딥러닝의 역사 __첫 번째 신경망 연구 붐 __두 번째 신경망 연구 붐 __세 번째 신경망 연구 붐 4.2 딥러닝의 계산 과정 __추론 단계 __학습 단계 4.3 파이토치를 이용한 MNIST 손글씨 이미지 분류 구현 __파이토치란? __파이토치 개발환경 갖추기 __MNIST 데이터 다운로드 __파이토치를 이용한 딥러닝 구현 ____1. 데이터 전처리 ____2. DataLoader 생성 ____3. 신경망 구성 ____4. 오차함수 및 최적화 기법 설정 ____5. 학습 및 추론 설정 ____6. 학습 및 추론 수행 파이토치 사용법에 대한 보충 설명 · 05장: 딥러닝을 적용한 강화학습 - DQN 구현 5.1 딥러닝을 적용한 Q러닝 __표형식 표현의 문제점 __심층강화학습 알고리즘 DQN 5.2 DQN을 구현할 때 중요한 4가지 기법 5.3 DQN 구현(1) __파이토치로 DQN을 구현할 때 주의점 __DQN 구현 5.4 DQN 구현(2) · 06장: 딥러닝을 적용한 강화학습 - 심화 과정 6.1 심층강화학습 알고리즘 지도 6.2 DDQN(Double-DQN) 구현 __DDQN __DDQN 구현 6.3 Dueling Network 구현 __Dueling Network __Dueling Network 구현 6.4 Prioritized Experience Replay 구현 __Prioritized Experience Replay __Prioritized Experience Replay 구현 6.5 A2C 구현 __A2C __A2C 구현 · 07장: AWS GPU 환경에서 벽돌 깨기 구현 7.1 벽돌 깨기 게임 “Breakout” 7.2 AWS로 GPU를 사용하는 딥러닝 실행 환경 구성 __우분투 터미널 설치 __가상 서버와 통신하는 데 사용할 키 생성 __AWS에서 딥러닝을 실행할 가상 서버 만들기 __벽돌 깨기 게임 실행 환경 구축 7.3 Breakout 학습에서 중요한 포인트 4가지 __로컬 PC 환경 설정 __Breakout 게임을 학습하는 데 중요한 포인트 4가지 7.4 A2C 구현(1) 7.5 A2C 구현(2) |
저오가와 유타로
관심작가 알림신청오가와 유타로 의 다른 상품
역심효섭
관심작가 알림신청심효섭의 다른 상품
★ 이 책에서 다루는 내용 ★
◎ 강화학습 기초 이론 ◎ 미로찾기를 통한 강화학습 구현 ◎ 역진자 문제를 통한 강화학습 구현 ◎ 파이토치를 이용한 딥러닝 구현 ◎ 심층강화학습 알고리즘 구현: DQN ◎ 기타 심층강화학습 알고리즘 및 구현 방법 ◎ AWS GPU 환경에서 벽돌 깨기 구현 |