文件列表:
基于强化学习的多通道反馈中的位置分配框架 - MDDL【英文版】.pdf |
下载文档 |
资源简介
>
英文标题:MDDL: A Framework for Reinforcement Learning-based Position Allocation in Multi-Channel Feed中文摘要:本文提出了一个名为 MDDL 的框架,可以有效地利用策略数据和随机数据来训练多分布数据中的 RL 模型,解决了当前在线模型中状态 - 行动对失衡分布和过度估计的问题,并在美团外卖平台上展示了其优越的性能。英文摘要:Nowadays, the mainstream approach in position allocation system is to utilizea reinforcement learning model to allocate appropriate locations for items invarious channels and then mix them into the feed. There are two types of dataemployed to train reinforcement learning (RL) model for pos
加载中...
已阅读到文档的结尾了