电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月19日
(此版本)
, 最新版本 2025年8月21日 (v3)
]
标题: 基于扩散模型的心脏容积重构的潜在插值学习
标题: Latent Interpolation Learning Using Diffusion Models for Cardiac Volume Reconstruction
摘要: 心脏磁共振(CMR)成像是诊断和管理心血管疾病的关键工具,但其效用常受限于二维短轴切片的稀疏采集,导致体积信息不完整。 从这些稀疏切片中准确的三维重建对于全面的心脏评估至关重要,但现有方法面临诸多挑战,包括依赖于预定义的插值方案(例如线性或球面),计算效率低下,以及依赖于额外的语义输入,如分割标签或运动数据。 为解决这些限制,我们提出了一种新颖的\textbf{钙}rdiac\textbf{L}atent\textbf{I}nterpolation\textbf{D}iffusion(CaLID)框架,该框架引入了三个关键创新。 首先,我们提出了一种基于扩散模型的数据驱动插值方案,可以捕捉稀疏切片之间的复杂非线性关系,并提高重建准确性。 其次,我们设计了一种计算高效的的方法,在潜在空间中运行,并将整个心脏的三维上采样时间加快了24倍,与之前的方法相比减少了计算开销。 第三,仅以稀疏的二维CMR图像作为输入,我们的方法在基线方法中实现了最先进(SOTA)的性能,消除了对辅助输入(如形态学指导)的需求,从而简化了工作流程。 我们进一步将方法扩展到二维+T数据,使能够有效建模时空动态并确保时间一致性。 广泛的体积评估和下游分割任务表明,CaLID实现了优越的重建质量和效率。 通过解决现有方法的基本限制,我们的框架推进了时空整体心脏重建的最先进水平,为心血管成像提供了一个强大且临床实用的解决方案。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.