计算机科学 > 硬件架构
[提交于 2025年8月17日
]
标题: 专题会议:在非易失性计算内存加速器上的深度神经网络可持续部署
标题: Special Session: Sustainable Deployment of Deep Neural Networks on Non-Volatile Compute-in-Memory Accelerators
摘要: 基于非易失性存储器(NVM)的存内计算(CIM)加速器已成为一种可持续解决方案,由于其就地数据处理能力,可显著提高深度神经网络(DNN)推理的能效并降低延迟。 然而,由于NVM器件的随机性和固有变化,NVCIM加速器的性能会下降。 传统的写入验证操作,在部署期间通过迭代写入和验证来提高推理准确性,但在能耗和时间上成本较高。 受负反馈理论的启发,我们提出了一种新的负优化训练机制,以实现针对NVCIM的鲁棒DNN部署。 我们开发了一种定向变分前向(OVF)训练方法来实现该机制。 实验表明,OVF在推理准确性方面比现有最先进技术提高了高达46.71%,同时减少了认知不确定性。 该机制减少了对写入验证操作的依赖,从而有助于NVCIM加速器的可持续和实用部署,在解决性能下降问题的同时保持了NVCIM加速器的可持续计算优势。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.