计算机科学 > 硬件架构
[提交于 2025年8月11日
]
标题: XDMA:异构多加速器SoC中布局灵活数据传输的分布式可扩展DMA架构
标题: XDMA: A Distributed, Extensible DMA Architecture for Layout-Flexible Data Movements in Heterogeneous Multi-Accelerator SoCs
摘要: 随着现代AI工作负载越来越多地依赖异构加速器,确保加速器内存之间的高带宽和布局灵活的数据移动已成为一个紧迫的挑战。 直接内存访问(DMA)引擎为数据移动提供了高带宽利用率,但通常仅在连续内存访问时最优,因此需要额外的软件循环来进行数据布局转换。 这反过来会导致过多的控制开销和未充分利用的片上互连。 为了克服这种低效问题,我们提出了XDMA,这是一种分布式且可扩展的DMA架构,能够在高链路利用率下实现布局灵活的数据移动。 我们引入了三个关键创新:(1) 一种作为XDMA前端的数据流引擎,用硬件地址生成器替代软件地址生成器;(2) 一种分布式DMA架构,最大化链路利用率并分离配置与数据传输;(3) XDMA的灵活插件,在数据传输过程中实现即时的数据操作。 XDMA在合成工作负载中比基于软件的实现具有高达151.2倍/8.2倍的链路利用率,并在实际应用中比现有最先进的DMA加速器平均快2.3倍。 我们的设计在现有最先进的DMA解决方案上仅增加<2%的面积开销,同时消耗系统功耗的17%。 XDMA证明了协同优化内存访问、布局转换和互连协议是释放异构多加速器SoC性能的关键。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.