文件列表:
Deep Reinforcement Learning tutorial.pdf |
下载文档 |
资源简介
>
ICML2016今天进入课程讲座环节,DeepMind的资深科学家、AlphaGo作者之一的David Silver作了题为《深度增强学习》(Deep Reinforcement Learning)的报告。新智元带来本次报告的全部PPT。与前几日发表在DeepMind博客上的综述性文章不一样的是,本次David具体描述了DeepMind在深度增强学习运用的细节,他认为AI=增强学习+深度学习,详细介绍了基于价值、策略和模型的三种深度增强学习实现途径。报告目录:
深度学习介绍
增强学习介绍
基于价值的深度增强学习
基于策略的深度增强学习
基于模型的深度增强学习
增强学习概述
增强学习是一种用于决策的通用框架
增强学习指的是具有行动能力的智能体
每一步行动都会影响智能体的未来状态
成功由标量的回报信号来衡量
目标:选择行动,实现未来回报的最大化
深度学习概述
深度学习是一种表示(representation)学习通用框架
给定对象
学习为了实现获取目标所必需的表示
直接从原始输入中获取
使用最小化的域知识
来源:deepmind.com 作者:David Silver 翻译:胡祥杰
加载中...
本文档仅能预览20页