×
img

联邦多臂赌博机的奖励训练(英文版)

发布者:wx****0e
2023-05-06
1 MB 13 页
人工智能(AI)
文件列表:
联邦多臂赌博机的奖励训练【英文版】.pdf
下载文档
英文标题:Reward Teaching for Federated Multi-armed Bandits中文摘要:本文提出了一种名为奖励教学的新颖概念,其中服务器通过隐式本地奖励调整来指导客户端向全局最优性靠拢。对于客户端无法修改现有协议的情况,作者提出了一种名为 Teaching-After-Learning(TAL) 的逐步方法,并通过开发技术方法分析了 TAL 的特定保证。在此基础上,提出了一种名为 Teaching-While-Learning(TWL) 的算法,其通过连续臂消除的思想打破了 TAL 中的非自适应分离,实验结果证明了该算法的有效性和广泛性。英文摘要:Most of the existing federated multi-armed bandits (FMAB) designs are basedon the presumption that clients will implement the specified design tocollaborate with the server. In reality, however, it may not be

加载中...

已阅读到文档的结尾了

下载文档

网友评论>