计算机科学 > 硬件架构
[提交于 2025年8月13日
(v1)
,最后修订 2025年8月27日 (此版本, v2)]
标题: 重新思考CGRA中的内存限制
标题: Re-thinking Memory-Bound Limitations in CGRAs
摘要: 粗粒度可重构阵列(CGRAs)是专门的加速器,通常用于提升具有迭代结构的工作负载的性能。 现有研究通常专注于编译器或架构优化,旨在提高CGRA的性能、能效、灵活性和面积利用率,在理想化的假设下,内核可以访问来自Scratchpad Memory(SPM)的所有数据。 然而,某些复杂的工作负载——特别是在图分析、不规则数据库操作和特定形式的高性能计算(例如,非结构化网格模拟)领域——表现出不规则的内存访问模式,这会阻碍CGRA的利用,有时低于1.5%,使CGRA成为内存受限的。 为了解决这一挑战,我们对性能下降的根本原因进行了深入分析,然后提出了重新设计的存储子系统并改进了存储模型。 通过微架构和理论优化,我们的解决方案可以通过CGRA特有的提前执行机制和缓存重新配置技术有效管理不规则的内存访问。 我们的结果表明,我们可以在仅需要原始SPM-only系统1.27%存储大小的情况下,实现相当的性能。 提前执行机制平均提升了3.04倍(最高达6.91倍),而缓存重新配置技术提供了额外的6.02%的改进,显著提升了CGRA在不规则内存访问模式下的性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.