《8 什么是 Deep Deterministic Policy Gradient (DDPG)》
(提示:如果视频分为多个小段,请下载后用视频合并软件合并。)#1 什么是强化学习? (Reinforcement Learning)
#2 强化学习方法汇总 (Reinforcement Learning)
#3 什么是 Q Learning (Reinforcement Learning)
#4 什么是 Sarsa (Reinforcement Learning 强化学习)
#5 什么是 Sarsa(lambda) (Reinforcement Learning 强化学习)
#6 什么是 DQN (Reinforcement Learning 强化学习)
莫烦 #7 什么是 Policy Gradients (Reinforcement Learning 强化学习)
莫烦 #8 什么是 Actor Critic (Reinforcement Learning 强化学习)
莫烦 #8 什么是 Deep Deterministic Policy Gradient (DDPG)(Reinforcement Learning 强化学习)
#9 什么是 A3C (Asynchronous Advantage Actor-Critic) (Reinforcement Learning 强化学习)