Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2508.01786

帮助 | 高级搜索

计算机科学 > 硬件架构

arXiv:2508.01786 (cs)
[提交于 2025年8月3日 (v1) ,最后修订 2025年8月21日 (此版本, v4)]

标题: 由10倍测试遗漏引发的静默数据损坏威胁可靠计算

标题: Silent Data Corruption by 10x Test Escapes Threatens Reliable Computing

Authors:Subhasish Mitra, Subho Banerjee, Martin Dixon, Rama Govindaraju, Peter Hochschild, Eric X. Liu, Bharath Parthasarathy, Parthasarathy Ranganathan
摘要: 现有制造测试中逃逸的缺陷计算芯片太多——在数据中心的所有计算芯片类型中,逃逸数量至少比工业目标高一个数量级。 由测试逃逸引起的静默数据损坏(SDCs)如果未得到解决,将对可靠计算构成重大威胁。 我们提出一种三管齐下的方法,概述克服测试逃逸的未来方向:(a) 从系统级错误行为直接诊断缺陷芯片。 这种诊断对于深入了解为何如此多的缺陷芯片逃过现有制造测试至关重要。 (b) 在现场检测缺陷芯片。 (c) 新的测试实验,以了解新检测缺陷芯片技术的有效性。 这些实验必须克服之前工业测试实验和案例研究的缺点和陷阱。
摘要: Too many defective compute chips are escaping existing manufacturing tests -- at least an order of magnitude more than industrial targets across all compute chip types in data centers. Silent data corruptions (SDCs) caused by test escapes, when left unaddressed, pose a major threat to reliable computing. We present a three-pronged approach outlining future directions for overcoming test escapes: (a) Quick diagnosis of defective chips directly from system-level incorrect behaviors. Such diagnosis is critical for gaining insights into why so many defective chips escape existing manufacturing testing. (b) In-field detection of defective chips. (c) New test experiments to understand the effectiveness of new techniques for detecting defective chips. These experiments must overcome the drawbacks and pitfalls of previous industrial test experiments and case studies.
主题: 硬件架构 (cs.AR)
ACM 类: B.7; C.0; C.5
引用方式: arXiv:2508.01786 [cs.AR]
  (或者 arXiv:2508.01786v4 [cs.AR] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.01786
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Bharath Parthasarathy [查看电子邮件]
[v1] 星期日, 2025 年 8 月 3 日 14:53:33 UTC (400 KB)
[v2] 星期二, 2025 年 8 月 19 日 13:59:00 UTC (408 KB)
[v3] 星期三, 2025 年 8 月 20 日 01:19:47 UTC (408 KB)
[v4] 星期四, 2025 年 8 月 21 日 14:56:19 UTC (409 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
许可图标 查看许可
当前浏览上下文:
cs.AR
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号