카트

이미지 검색을 사용해 보세요

검색창 이전화면 이전화면

최근 검색어: 전체삭제

인기 검색어

닫기

미리보기 공유하기

소득공제 PDF

eBook 파이썬과 케라스로 배우는 강화학습

내 손으로 직접 구현하는 게임 인공지능 스마트한 PDF 필기 기능을 사용해 보세요!

김건우,이웅원,양혁렬,이영무,이의령 저

위키북스 2021.06.02.

리뷰 총점 9.6 회원리뷰 5 판매지수 78

가격: 19,600원

17,640 19,600 쿠폰혜택가

YES포인트?: 980원 (5%)

5만원 이상 구매 시 2천원 추가 적립

사용 가능한 쿠폰 받기

앱 다운 시 1천원 상품권

결제혜택: 카드/간편결제 혜택을 확인하세요

PDF 안내

이 상품은 구매 후 지원 기기에서 예스24 eBook앱 설치 후 바로 이용 가능한 상품입니다.

예스24만의 독보적인 PDF 필기 기능을 경험해 보세요!

이 분야의 이벤트

시리즈 태그 업체 공지사항 구성 소개 특별 구성 MD 한마디 카드뉴스 상세 이미지 소개 관련 동영상 목차 미리듣기 저자 소개 관련분류 품목정보 만든이 코멘트 예스24 리뷰 책 속으로 줄거리 캐스팅 관련 자료 부가 영상 출판사 리뷰 전문가 리뷰 추천평

펼치기/닫기

이 상품의 태그

#파이썬

eBook

Do it! 점프 투 파이썬

15,000원

상품명 이동
eBook

밑바닥부터 시작하는 딥러닝 1

20,800원

상품명 이동
eBook

혼자 공부하는 파이썬(개정판)

17,600원

상품명 이동
eBook

실무로 통하는 인과추론 with 파이썬

30,400원

상품명 이동
eBook

밑바닥부터 시작하는 딥러닝 2

23,200원

상품명 이동
eBook

혼자 만들면서 공부하는 딥러닝

22,400원

상품명 이동
eBook

코딩 테스트 합격자 되기 - 파이썬 편

32,000원

상품명 이동
eBook

모두의 데이터 분석 with 파이썬

12,600원

상품명 이동
eBook

코딩 자율학습 나도코딩의 파이썬 입문

19,200원

상품명 이동
eBook

파이썬 라이브러리를 활용한 머신러닝

26,400원

상품명 이동
eBook

1일 1로그 100일 완성 IT 지식

16,000원

상품명 이동
eBook

파이썬 라이브러리를 활용한 데이터 분석 (3판)

31,200원

상품명 이동
eBook

자연어 처리를 위한 허깅페이스 트랜스포머 하드 트레이닝

22,000원

상품명 이동
eBook

챗GPT로 만드는 주식 & 암호화폐 자동매매 시스템

14,000원

상품명 이동
eBook

모두의 파이썬(개정 2판)

8,400원

상품명 이동
eBook

모두의 한국어 텍스트 분석 with 파이썬

21,600원

상품명 이동
eBook

파이썬과 케라스로 배우는 강화학습

19,600원

상품명 이동
eBook

게임으로 배우는 파이썬

10% 9,900원

상품명 이동
eBook

밑바닥부터 시작하는 웹 브라우저

36,000원

상품명 이동
eBook

난생처음 파이썬 프로그래밍

24,000원

상품명 이동
더보기

상세 이미지

상세 이미지 더보기펼치기

소개

소개 더보기펼치기

[1부] 강화학습 소개

▣ 1장: 강화학습 개요
___강화학습의 개념
___스키너의 강화 연구
___우리 주변에서의 강화
___머신러닝과 강화학습
___스스로 학습하는 컴퓨터, 에이전트
강화학습 문제
___순차적 행동 결정 문제
___순차적 행동 결정 문제의 구성 요소
___방대한 상태를 가진 문제에서의 강화학습
강화학습의 예시: 브레이크아웃
___딥마인드에 의해 다시 빛을 본 아타리 게임
___브레이크아웃의 MDP와 학습 방법
정리
___강화학습의 개념
___강화학습 문제
___강화학습의 예시: 브레이크아웃

[2부] 강화학습 기초

▣ 2장: 강화학습 기초 1 - MDP와 벨만 방정식
MDP
___상태
___행동
___보상함수
___상태 변환 확률
___할인율
___정책
가치함수
___가치함수
큐함수
벨만 방정식
___벨만 기대 방정식
___벨만 최적 방정식
정리
___MDP
___가치함수
___벨만 방정식

▣ 3장: 강화학습 기초 2 - 그리드월드와 다이내믹 프로그래밍
다이내믹 프로그래밍과 그리드월드
___순차적 행동 결정 문제
___다이내믹 프로그래밍
___격자로 이뤄진 간단한 예제: 그리드월드
다이내믹 프로그래밍 1: 정책 이터레이션
___강화학습 알고리즘의 흐름
___정책 이터레이션
___정책 평가
___정책 발전
___정책 이터레이션 코드 설명
___정책 이터레이션 코드 실행
다이내믹 프로그래밍 2: 가치 이터레이션
___명시적인 정책과 내재적인 정책
___벨만 최적 방정식과 가치 이터레이션
___가치 이터레이션 코드 설명
___가치 이터레이션 코드 실행
다이내믹 프로그래밍의 한계와 강화학습
___다이내믹 프로그래밍의 한계
___모델 없이 학습하는 강화학습
정리
___다이내믹 프로그래밍과 그리드월드
___다이내믹 프로그래밍 1: 정책 이터레이션
___다이내믹 프로그래밍 2: 가치 이터레이션
___다이내믹 프로그래밍의 한계와 강화학습

▣ 4장: 강화학습 기초 3 - 그리드월드와 큐러닝
강화학습과 정책 평가 1: 몬테카를로 예측
___사람의 학습 방법과 강화학습의 학습 방법
___강화학습의 예측과 제어
___몬테카를로 근사의 예시
___샘플링과 몬테카를로 예측
강화학습과 정책 평가 2: 시간차 예측
___시간차 예측
강화학습 알고리즘 1: 살사
___살사
___살사 코드 설명
___살사 코드의 실행 및 결과
강화학습 알고리즘 2: 큐러닝
___살사의 한계
___큐러닝 이론
___큐러닝 코드 설명
___큐러닝 코드의 실행 결과
정리
___강화학습과 정책 평가 1: 몬테카를로 예측
___강화학습과 정책 평가 2: 시간차 예측
___강화학습 알고리즘 1: 살사
___강화학습 알고리즘 2: 큐러닝

[3부] 강화학습 심화

▣ 5장: 강화학습 심화 1 - 그리드월드와 근사함수
근사함수
___몬테카를로, 살사, 큐러닝의 한계
___근사함수를 통한 가치함수의 매개변수화
인공신경망
___인공신경망 1: 인공신경망의 개념
___인공신경망 2: 노드와 활성함수
___인공신경망 3: 딥러닝
___인공신경망 4: 신경망의 학습
인공신경망 라이브러리: 케라스
___텐서플로 2.0과 케라스 소개
___간단한 케라스 예제
딥살사
___딥살사 이론
___딥살사 코드 설명
___딥살사의 실행 및 결과
폴리시 그레이디언트
___정책 기반 강화학습
___폴리시 그레이디언트
___REINFORCE 코드 설명
___REINFORCE의 실행 및 결과
정리
___근사함수
___인공신경망
___인공신경망 라이브러리: 케라스
___딥살사
___폴리시 그레이디언트

▣ 6장: 강화학습 심화 2 - 카트폴
알고리즘 1: DQN
___카트폴 예제의 정의
___DQN 이론
___DQN 코드 설명
___DQN 실행 및 결과
알고리즘 2: 액터-크리틱
___액터-크리틱 이론 소개
___액터-크리틱 코드 설명
___액터-크리틱 실행 및 결과
___연속적 액터-크리틱 이론 소개
___연속적 액터-크리틱 코드 설명
___연속적 액터-크리틱 실행 및 결과
정리
___알고리즘 1: DQN
___알고리즘 2: 액터-크리틱

▣ 7장: 강화학습 심화 3 - 아타리
브레이크아웃 DQN
___아타리: 브레이크아웃
___컨볼루션 신경망(CNN)이란?
___브레이크아웃의 컨볼루션 신경망
___DQN 학습 전 준비 사항
___DQN 코드 설명
___텐서보드 사용법
___브레이크아웃 DQN 실행 및 결과
브레이크아웃 A3C
___DQN의 한계
___A3C란?
___멀티스레딩 소개
___브레이크아웃 A3C 코드 설명
___브레이크아웃 A3C 실행 결과
정리
___브레이크아웃 DQN
___브레이크아웃 A3C

▣ 참고문헌

목차 더보기펼치기

저자 소개 5

저김건우

관심작가 알림신청

뉴욕 대학교에서 컴퓨터과학 학사 학위를 받았습니다. 우버 드라이버 프라이싱 팀에서 소프트웨어 엔지니어로 재직 중이다. 대학교를 다니며 딥러닝과 강화학습 스터디 그룹에 참여하여 『파이썬과 케라스로 배우는 강화학습』(위키북스, 2017)을 공동 집필했다.

김건우의 다른 상품

eBook

펭귄브로의 3분 딥러닝, 파이토치맛

22,400원

펭귄브로의 3분 딥러닝, 파이토치맛 이동

저이웅원

관심작가 알림신청

연세대학교 기계공학과를 졸업했다. 당근마켓에서 머신러닝 엔지니어 겸 프로덕트 매니저로서 재직 중이다. 그전에는 제이마플에서 딥러닝을 활용한 소리 인식기, 네이버에서 OCR을 연구했다. 머신러닝과 서비스가 맞닿은 지점에서 일하는 것을 즐긴다.

이웅원의 다른 상품

eBook

삶에 의문을 가진 당신에게

12,000원

삶에 의문을 가진 당신에게 이동

저양혁렬

관심작가 알림신청

홍콩과학기술대학교 컴퓨터 공학과 석사과정에 재학 중이다. Visual Intelligence 랩에서 딥러닝을 이용한 오디오와 영상처리 연구를 진행 중이다.

저이영무

관심작가 알림신청

중앙대학교 컴퓨터공학과를 졸업했다. 현재는 당근마켓에서 머신러닝 엔지니어로 재직 중이며 추천을 비롯한 다양한 머신러닝 기술에 관심을 갖고 있다.

저이의령

관심작가 알림신청

세종대학교 응용통계학을 졸업했다. 현재는 자동차 회사에서 머신러닝 엔지니어 업무를 하고 있다. 주로 자동차 R&D 과정에서 생성되는 이미지와 3D 데이터로 경험치를 쌓고 있다.

더보기펼치기

품목정보

발행일: 2021년 06월 02일

이용안내

배송 없이 구매 후 바로 읽기
이용기간 제한없음
TTS 가능 ?

지원기기: 크레마, PC(윈도우 - 4K 모니터 미지원), 아이폰, 아이패드, 안드로이드폰, 안드로이드패드, 전자책단말기(저사양 기기 사용 불가), PC(Mac)

파일/용량: PDF(DRM) | 13.36MB ?

글자 수/ 페이지 수: 약 380쪽 ?

ISBN13: 9791158392635

출판사 리뷰

★ 이 책에서 다루는 내용 ★

◎ 강화학습의 배경과 개념
◎ 강화학습의 기초 이론: MDP, 벨만 방정식, 다이내믹 프로그래밍
◎ 고전 강화학습 알고리즘: 몬테카를로, 살사, 큐러닝
◎ 인공신경망을 이용한 강화학습 알고리즘: 딥살사, REINFORCE, DQN, 액터-크리틱, A3C
◎ 강화학습 알고리즘 구현: 그리드월드, 카트폴, 아타리게임

출판사 리뷰 더보기펼치기