文件列表:
使用多步逆运动学的表示学习:一种高效和优化的方法用于丰富观测的强化学习【英文版】.pdf |
下载文档 |
资源简介
>
英文标题:Representation Learning with Multi-Step Inverse Kinematics: An Efficient and Optimal Approach to Rich-Observation RL中文摘要:本文提出了一种名为 MusIK 的强化学习算法,通过多步反向运动学的表示学习结合系统性探索,实现在最小统计前提下,以理想的样本复杂度达到所需精度水平的计算效率,可适用于通用函数近似。英文摘要:We study the design of sample-efficient algorithms for reinforcement learningin the presence of rich, high-dimensional observations, formalized via theBlock MDP problem. Existing algorithms suffer from either 1) computationalintractability, 2) strong statistical assumptions th
加载中...
本文档仅能预览20页