计算机科学 > 硬件架构
[提交于 2025年8月4日
(v1)
,最后修订 2025年10月3日 (此版本, v2)]
标题: ReGate:在神经处理单元中实现电源门控
标题: ReGate: Enabling Power Gating in Neural Processing Units
摘要: 神经处理单元(NPU)的能效在开发可持续数据中心中起着关键作用。 我们的研究显示,不同代的NPU芯片中,30%-72%的能耗是由静态功耗引起的,这是由于现代NPU芯片缺乏电源管理支持。 在本文中,我们提出了ReGate,它通过软硬件协同设计,实现了对NPU芯片中每个硬件组件的细粒度电源门控。 与传统用于通用处理器的电源门控技术不同,由于硬件架构和程序执行模型的根本差异,在NPU中实现电源门控面临独特的挑战。 为了解决这些挑战,我们仔细研究了NPU芯片中每个组件的电源门控机会,并决定最适合的电源管理方案(即硬件管理或软件管理的电源门控)。 具体来说,对于具有确定性执行模式的脉动阵列(SAs),ReGate根据SAs中的固有数据流执行,在处理元素(PE)的粒度上实现周期级的电源门控。 对于具有较长空闲间隔的芯片间互连(ICI)和HBM控制器,ReGate采用了一种轻量级的基于硬件的空闲检测机制。 对于向量单元和SRAM,它们的空闲时间根据工作负载模式变化较大,ReGate扩展了NPU指令集架构(ISA),并允许编译器等软件管理电源门控。 在生产级别的NPU模拟器上实现后,我们展示了ReGate可以将NPU芯片的能耗降低多达32.8%(平均15.5%),对AI工作负载性能的影响可以忽略不计。 电源门控逻辑的硬件实现对NPU芯片的开销小于3.3%。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.