×
>>
视频信息:不能播放?点击修复
  • 1 什么是强化学习?
  • 2 强化学习方法汇总
  • 3 什么是 Q Learning
  • 4 什么是 Sarsa
  • 5 什么是 Sarsa(lambda)
  • 6 什么是 DQN
  • 7 什么是 Policy Gradients
  • 8 什么是 Actor Critic
  • 8 什么是 Deep Deterministic Policy Gradient (DDPG)
  • 9 什么是 A3C (Asynchronous Advantage Actor-Critic)
  • 猜你喜欢
  • 视频介绍
  • 分集列表
  • 视频下载