文件列表:
基于控制不变集增强型强化学习的过程控制:提高采样效率和保证稳定性【英文版】.pdf |
下载文档 |
资源简介
>
英文标题:Control invariant set enhanced reinforcement learning for process control: improved sampling efficiency and guaranteed stability中文摘要:本文提出了一种新的强化学习培训方法,称为控制不变集(CIS)增强 RL,该方法通过控制不变集的优势改善稳定性和采样效率,其中包括离线和在线的两个学习阶段,使用 CIS 来设计奖励、采样初始状态和状态重置程序,并在状态不在 CIS 时重新训练 RL,以确保在线稳定;在模拟化学反应器中进行应用,结果表明,在离线训练期间,采样效率显著提高,并且实现了闭环稳定性。英文摘要:Reinforcement learning (RL) is an area of significant research interest, andsafe RL in particular is attracting attention due to its ability to handlesafety-driven constraints t
加载中...
已阅读到文档的结尾了