《9 什么是 A3C (Asynchronous Advantage Actor-Critic) 》

（提示：如果视频分为多个小段，请下载后用视频合并软件合并。）

序号选择视频教程名称大小操作

暂无下载

外唐网视频教程合并软件下载地址：
http://www.waitang.com/upload/flvtool.zip

教程列表：

#1 什么是强化学习? (Reinforcement Learning)

#2 强化学习方法汇总 (Reinforcement Learning)

#3 什么是 Q Learning (Reinforcement Learning)

#4 什么是 Sarsa (Reinforcement Learning 强化学习)

#5 什么是 Sarsa(lambda) (Reinforcement Learning 强化学习)

#6 什么是 DQN (Reinforcement Learning 强化学习)

莫烦 #7 什么是 Policy Gradients (Reinforcement Learning 强化学习)

莫烦 #8 什么是 Actor Critic (Reinforcement Learning 强化学习)

莫烦 #8 什么是 Deep Deterministic Policy Gradient (DDPG)(Reinforcement Learning 强化学习)

#9 什么是 A3C (Asynchronous Advantage Actor-Critic) (Reinforcement Learning 强化学习)

视频信息：在线观看>

秒懂强化学习 Reinforcement learning

教程主讲：

关键词：

下载列表:共10讲