联邦多臂赌博机的奖励训练（英文版）

发布者：wx****0e

2023-05-06

1 MB 13 页

人工智能（AI）

文件列表：

联邦多臂赌博机的奖励训练【英文版】.pdf

下载文档

资源简介

英文标题：Reward Teaching for Federated Multi-armed Bandits中文摘要：本文提出了一种名为奖励教学的新颖概念，其中服务器通过隐式本地奖励调整来指导客户端向全局最优性靠拢。对于客户端无法修改现有协议的情况，作者提出了一种名为 Teaching-After-Learning（TAL) 的逐步方法，并通过开发技术方法分析了 TAL 的特定保证。在此基础上，提出了一种名为 Teaching-While-Learning（TWL) 的算法，其通过连续臂消除的思想打破了 TAL 中的非自适应分离，实验结果证明了该算法的有效性和广泛性。英文摘要：Most of the existing federated multi-armed bandits (FMAB) designs are basedon the presumption that clients will implement the specified design tocollaborate with the server. In reality, however, it may not be

加载中...

已阅读到文档的结尾了

下载文档