计算机科学 > 硬件架构
[提交于 2025年8月3日
(v1)
,最后修订 2025年8月21日 (此版本, v4)]
标题: 由10倍测试遗漏引发的静默数据损坏威胁可靠计算
标题: Silent Data Corruption by 10x Test Escapes Threatens Reliable Computing
摘要: 现有制造测试中逃逸的缺陷计算芯片太多——在数据中心的所有计算芯片类型中,逃逸数量至少比工业目标高一个数量级。 由测试逃逸引起的静默数据损坏(SDCs)如果未得到解决,将对可靠计算构成重大威胁。 我们提出一种三管齐下的方法,概述克服测试逃逸的未来方向:(a) 从系统级错误行为直接诊断缺陷芯片。 这种诊断对于深入了解为何如此多的缺陷芯片逃过现有制造测试至关重要。 (b) 在现场检测缺陷芯片。 (c) 新的测试实验,以了解新检测缺陷芯片技术的有效性。 这些实验必须克服之前工业测试实验和案例研究的缺点和陷阱。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.