Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2508.02536

帮助 | 高级搜索

计算机科学 > 硬件架构

arXiv:2508.02536 (cs)
[提交于 2025年8月4日 (v1) ,最后修订 2025年10月3日 (此版本, v2)]

标题: ReGate:在神经处理单元中实现电源门控

标题: ReGate: Enabling Power Gating in Neural Processing Units

Authors:Yuqi Xue, Jian Huang
摘要: 神经处理单元(NPU)的能效在开发可持续数据中心中起着关键作用。 我们的研究显示,不同代的NPU芯片中,30%-72%的能耗是由静态功耗引起的,这是由于现代NPU芯片缺乏电源管理支持。 在本文中,我们提出了ReGate,它通过软硬件协同设计,实现了对NPU芯片中每个硬件组件的细粒度电源门控。 与传统用于通用处理器的电源门控技术不同,由于硬件架构和程序执行模型的根本差异,在NPU中实现电源门控面临独特的挑战。 为了解决这些挑战,我们仔细研究了NPU芯片中每个组件的电源门控机会,并决定最适合的电源管理方案(即硬件管理或软件管理的电源门控)。 具体来说,对于具有确定性执行模式的脉动阵列(SAs),ReGate根据SAs中的固有数据流执行,在处理元素(PE)的粒度上实现周期级的电源门控。 对于具有较长空闲间隔的芯片间互连(ICI)和HBM控制器,ReGate采用了一种轻量级的基于硬件的空闲检测机制。 对于向量单元和SRAM,它们的空闲时间根据工作负载模式变化较大,ReGate扩展了NPU指令集架构(ISA),并允许编译器等软件管理电源门控。 在生产级别的NPU模拟器上实现后,我们展示了ReGate可以将NPU芯片的能耗降低多达32.8%(平均15.5%),对AI工作负载性能的影响可以忽略不计。 电源门控逻辑的硬件实现对NPU芯片的开销小于3.3%。
摘要: The energy efficiency of neural processing units (NPU) is playing a critical role in developing sustainable data centers. Our study with different generations of NPU chips reveals that 30%-72% of their energy consumption is contributed by static power dissipation, due to the lack of power management support in modern NPU chips. In this paper, we present ReGate, which enables fine-grained power-gating of each hardware component in NPU chips with hardware/software co-design. Unlike conventional power-gating techniques for generic processors, enabling power-gating in NPUs faces unique challenges due to the fundamental difference in hardware architecture and program execution model. To address these challenges, we carefully investigate the power-gating opportunities in each component of NPU chips and decide the best-fit power management scheme (i.e., hardware- vs. software-managed power gating). Specifically, for systolic arrays (SAs) that have deterministic execution patterns, ReGate enables cycle-level power gating at the granularity of processing elements (PEs) following the inherent dataflow execution in SAs. For inter-chip interconnect (ICI) and HBM controllers that have long idle intervals, ReGate employs a lightweight hardware-based idle-detection mechanism. For vector units and SRAM whose idle periods vary significantly depending on workload patterns, ReGate extends the NPU ISA and allows software like compilers to manage the power gating. With implementation on a production-level NPU simulator, we show that ReGate can reduce the energy consumption of NPU chips by up to 32.8% (15.5% on average), with negligible impact on AI workload performance. The hardware implementation of power-gating logic introduces less than 3.3% overhead in NPU chips.
评论: 被MICRO'25接受
主题: 硬件架构 (cs.AR)
引用方式: arXiv:2508.02536 [cs.AR]
  (或者 arXiv:2508.02536v2 [cs.AR] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.02536
通过 DataCite 发表的 arXiv DOI
相关 DOI: https://doi.org/10.1145/3725843.3756038
链接到相关资源的 DOI

提交历史

来自: Yuqi Xue [查看电子邮件]
[v1] 星期一, 2025 年 8 月 4 日 15:44:59 UTC (893 KB)
[v2] 星期五, 2025 年 10 月 3 日 19:07:24 UTC (892 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
cs.AR
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号