计算机科学 > 硬件架构
[提交于 2025年8月3日
(此版本)
, 最新版本 2025年8月21日 (v4)
]
标题: 10倍测试逃逸引发的静默数据损坏威胁可靠计算
标题: Silent Data Corruption by 10x Test Escapes Threatens Reliable Computing
摘要: 现有制造测试中存在过多有缺陷的计算芯片逃过了检测——在数据中心的所有计算芯片类型中,其数量至少比工业目标高一个数量级。 由测试遗漏引起的静默数据损坏(SDCs),在未得到解决的情况下,对可靠计算构成了重大威胁。 我们提出一种三管齐下的方法,以应对未来克服测试遗漏的方向:(a) 从系统级错误行为直接诊断有缺陷的芯片。 这种诊断对于深入了解为何如此多的有缺陷芯片逃过了现有的制造测试至关重要。 (b) 在现场检测有缺陷的芯片。 (c) 新的测试实验,以理解新检测有缺陷芯片技术的有效性。 这些实验必须克服之前工业测试实验和案例研究的缺点和陷阱。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.