Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2306.00280v1

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:2306.00280v1 (cs)
[提交于 2023年6月1日 ]

标题: 面向非均匀和时变通信的FedAvg偏差校正

标题: Towards Bias Correction of FedAvg over Nonuniform and Time-Varying Communications

Authors:Ming Xiang, Stratis Ioannidis, Edmund Yeh, Carlee Joe-Wong, Lili Su
摘要: 联邦学习(FL)是一种去中心化的学习框架,其中参数服务器(PS)和一组客户端通过最小化全局目标协同训练模型。 通信带宽是一种稀缺资源;在每一轮中,PS仅聚合一部分客户端的更新。 在本文中,我们关注非凸最小化问题,该问题容易受到PS与客户端之间非均匀且随时间变化的通信故障的影响。 具体来说,在每一轮$t$中,PS与客户端$i$之间的链接以概率$p_i^t$活动,该概率对PS和客户端都是$\textit{unknown}$。 当客户端之间的信道条件异质且随时间变化时,就会出现这种情况。 我们表明,当$p_i^t$不是均匀分布时,广泛采用的FL算法$\textit{Federated Average}$(FedAvg)无法最小化全局目标。 观察到这一点后,我们提出了$\textit{Federated Postponed Broadcast}$(FedPBC),这是FedAvg的一个简单变体。 它与FedAvg的不同之处在于,PS会将全局模型的广播推迟到每一轮结束时。 我们证明FedPBC可以收敛到原始目标的平稳点。 引入的延迟是轻微的,没有明显的减速。 提供了理论分析和数值结果。 在技术方面,推迟全局模型的广播使得在第$t$轮中具有活动链接的客户端之间能够进行隐式的闲聊。 尽管$p_i^t$是时变的,但我们能够通过控制闲聊类型的信息混合误差的技术来限制全局模型动态的扰动。
摘要: Federated learning (FL) is a decentralized learning framework wherein a parameter server (PS) and a collection of clients collaboratively train a model via minimizing a global objective. Communication bandwidth is a scarce resource; in each round, the PS aggregates the updates from a subset of clients only. In this paper, we focus on non-convex minimization that is vulnerable to non-uniform and time-varying communication failures between the PS and the clients. Specifically, in each round $t$, the link between the PS and client $i$ is active with probability $p_i^t$, which is $\textit{unknown}$ to both the PS and the clients. This arises when the channel conditions are heterogeneous across clients and are changing over time. We show that when the $p_i^t$'s are not uniform, $\textit{Federated Average}$ (FedAvg) -- the most widely adopted FL algorithm -- fails to minimize the global objective. Observing this, we propose $\textit{Federated Postponed Broadcast}$ (FedPBC) which is a simple variant of FedAvg. It differs from FedAvg in that the PS postpones broadcasting the global model till the end of each round. We show that FedPBC converges to a stationary point of the original objective. The introduced staleness is mild and there is no noticeable slowdown. Both theoretical analysis and numerical results are provided. On the technical front, postponing the global model broadcasts enables implicit gossiping among the clients with active links at round $t$. Despite $p_i^t$'s are time-varying, we are able to bound the perturbation of the global model dynamics via the techniques of controlling the gossip-type information mixing errors.
主题: 机器学习 (cs.LG) ; 分布式、并行与集群计算 (cs.DC); 机器学习 (stat.ML)
引用方式: arXiv:2306.00280 [cs.LG]
  (或者 arXiv:2306.00280v1 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.2306.00280
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Ming Xiang [查看电子邮件]
[v1] 星期四, 2023 年 6 月 1 日 01:52:03 UTC (548 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2023-06
切换浏览方式为:
cs
cs.DC
stat
stat.ML

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号