- 在线播放
- 分集下载
- 第1集
- 1 什么是强化学习?
- 第3集
- 2 强化学习方法汇总
- 第5集
- 1 why?
- 第7集
- 2 要求准备
- 第9集
- 3 什么是 Q Learning
- 第11集
- 3 简单例子
- 第13集
- 4 Q Learning 算法更新
- 第15集
- 5 Q Learning 思维决策
- 第17集
- 4 什么是 Sarsa
- 第19集
- 6 Sarsa 算法更新
- 第21集
- 7 Sarsa 思维决策
- 第23集
- 7 什么是 Policy Gradients
- 第25集
- 5 什么是 Sarsa(lambda)
- 第27集
- 8 Sarsa(lambda)
- 第29集
- 8 什么是 Actor Critic
- 第31集
- 6 什么是 DQN
- 第33集
- 8 什么是 Deep Deterministic Policy Gradient (DDPG)
- 第35集
- 9 什么是 A3C (Asynchronous Advantage Actor-Critic)
- 第37集
- 9 DQN 算法更新
- 第39集
- 10 DQN 神经网络
- 第41集
- 11 DQN 思维决策
- 第43集
- 12 OpenAI Gym
- 第45集
- 12.1 Double DQN
- 第47集
- 12.2 DQN with Prioritised Replay
- 第49集
- 12.3 Dueling DQN
- 第51集
- 13 Policy Gradients 算法更新
- 第53集
- 14 Policy Gradients 思维决策
- 第55集
- 15 Actor Critic 演员评论家
- 第57集
- 16 DDPG
- 第59集
- 17 A3C
- 第61集
- 18 PPO/DPPO Proximal Policy Optimization
强化学习 Reinforcement Learning Python 教学教程的相关介绍
用 python 实现强化学习教程
教程列表:#1 什么是强化学习? (Reinforcement Learning)
#2 强化学习方法汇总 (Reinforcement Learning)
莫烦 #1 why? (强化学习 Reinforcement Learning 教学教程)
莫烦 #2 要求准备 (强化学习 Reinforcement Learning 教学)
#3 什么是 Q Learning (Reinforcement Learning)
莫烦 #3 简单例子 (强化学习 Reinforcement Learning 教学)
莫烦 #4 Q Learning 算法更新 (强化学习 Reinforcement Learning 教学)
莫烦 #5 Q Learning 思维决策 (强化学习 Reinforcement Learning 教学)
#4 什么是 Sarsa (Reinforcement Learning 强化学习)
莫烦 #6 Sarsa 算法更新 (强化学习 Reinforcement Learning 教学)
莫烦 #7 Sarsa 思维决策 (强化学习 Reinforcement Learning 教学)
#5 什么是 Sarsa(lambda) (Reinforcement Learning 强化学习)
莫烦 #8 Sarsa(lambda) (强化学习 Reinforcement Learning 教学)
#6 什么是 DQN (Reinforcement Learning 强化学习)
莫烦 #9 DQN 算法更新 (强化学习 Reinforcement Learning 教学)
莫烦 #10 DQN 神经网络 (强化学习 Reinforcement Learning 教学)
莫烦 #11 DQN 思维决策 (强化学习 Reinforcement Learning 教学)
莫烦 #12 OpenAI Gym (强化学习 Reinforcement Learning 教学)
莫烦 #12.1* Double DQN (强化学习 Reinforcement Learning 教学)
莫烦 #12.2* DQN with Prioritised Replay (强化学习 Reinforcement Learning 教学)
莫烦 #12.3* Dueling DQN (强化学习 Reinforcement Learning 教学)
莫烦 #7 什么是 Policy Gradients (Reinforcement Learning 强化学习)
莫烦 #13 Policy Gradients 算法更新 (强化学习 Reinforcement Learning 教学)
莫烦 #14 Policy Gradients 思维决策 (强化学习 Reinforcement Learning 教学)
莫烦 #8 什么是 Actor Critic (Reinforcement Learning 强化学习)
莫烦 #15 Actor Critic 演员评论家 (强化学习 Reinforcement Learning 教学)
莫烦 #8 什么是 Deep Deterministic Policy Gradient (DDPG)(Reinforcement Learning 强化学习)
莫烦 #16 DDPG (强化学习 Reinforcement Learning 教学)
#9 什么是 A3C (Asynchronous Advantage Actor-Critic) (Reinforcement Learning 强化学习)
莫烦 #17 A3C (强化学习 Reinforcement Learning 教学)
莫烦 #18 PPO/DPPO Proximal Policy Optimization 强化学习