学习团队对齐：基于多智体团队的自适应 Credo 框架（英文版）

发布者：wx****61

2023-04-22

3 MB 8 页

人工智能（AI）

文件列表：

学习团队对齐：基于多智体团队的自适应 Credo 框架【英文版】.pdf

下载文档

资源简介

英文标题：Learning to Learn Group Alignment: A Self-Tuning Credo Framework with Multiagent Teams中文摘要：在多智能体团队中使用混合激励机制具有优势，作者们提出了一个框架，在此框架下，学习智能体可以通过其奖励函数的不同部分自我调节其激励配置。他们的模型基于分层强化学习和元学习的思想，可以学习支持行为策略发展的奖励函数的配置。初步结果表明，通过自我调整各自的团队配置参数，智能体可以实现更好的全局结果。英文摘要：Mixed incentives among a population with multiagent teams has been shown tohave advantages over a fully cooperative system; however, discovering the bestmixture of incentives or team structure is a difficult and dynamic problem. Wepropose a framework

加载中...

已阅读到文档的结尾了

下载文档