文件列表:
最大因果熵限制的强化学习【英文版】.pdf |
下载文档 |
资源简介
>
英文标题:Maximum Causal Entropy Inverse Constrained Reinforcement Learning中文摘要:提出一种基于最大因果熵的方法来学习环境约束下的最优策略,该方法利用在约束下运作的代理的演示进行学习,证明了其在表格设置中的收敛性并提供了一个可扩展到复杂环境的近似值。通过评估奖励和约束违规数,评估学习策略的有效性,并基于其在其他代理中的可转移性评估学习成本函数。此方法已经在各种任务和环境中表现优于现有技术,能够处理具有随机动态和连续状态动作空间的问题。英文摘要:When deploying artificial agents in real-world environments where theyinteract with humans, it is crucial that their behavior is aligned with thevalues, social norms or other requirements of that environment. However, manyenvironments have imp
加载中...
本文档仅能预览20页