Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2508.01460

帮助 | 高级搜索

计算机科学 > 计算机视觉与模式识别

arXiv:2508.01460 (cs)
[提交于 2025年8月2日 ]

标题: 基于深度学习贝叶斯建模的不确定性感知分割质量预测:皮肤癌和肝脏分割的全面评估与解释

标题: Uncertainty-Aware Segmentation Quality Prediction via Deep Learning Bayesian Modeling: Comprehensive Evaluation and Interpretation on Skin Cancer and Liver Segmentation

Authors:Sikha O K, Meritxell Riera-Marín, Adrian Galdran, Javier García Lopez, Julia Rodríguez-Comas, Gemma Piella, Miguel A. González Ballester
摘要: 图像分割是计算生物医学图像分析中的关键步骤,通常在训练和验证过程中使用Dice系数等指标进行评估。然而,在没有手动标注的临床环境中,评估分割质量变得具有挑战性,缺乏可靠性指标的模型面临采用障碍。为解决这一差距,我们提出了一种新框架,在测试时无需真实标注即可预测分割质量。我们的方法引入了两个互补框架:一个利用预测的分割和不确定性图,另一个整合原始输入图像、不确定性图和预测的分割图。我们提出了两种基准分割模型——SwinUNet和带有ResNet50的特征金字塔网络的贝叶斯适应版本,使用蒙特卡洛Dropout、集成和测试时间增强来量化不确定性。我们在二维皮肤病变和三维肝脏分割数据集上评估了四种不确定性估计:置信度图、熵、互信息和期望成对Kullback-Leibler散度,并分析了它们与分割质量指标的相关性。我们的框架在HAM10000数据集上达到了93.25的R2分数和96.58的皮尔逊相关性,优于之前的分割质量评估方法。对于三维肝脏分割,使用熵的测试时间增强达到了85.03的R2分数和65.02的皮尔逊相关性,展示了跨模态的鲁棒性。此外,我们提出了一种聚合策略,将多个不确定性估计结合成每张图像的一个分数,提供更稳健和全面的分割质量评估。最后,我们使用Grad-CAM和基于UMAP的嵌入分析来解释模型的行为和可靠性,突出了不确定性集成的影响。
摘要: Image segmentation is a critical step in computational biomedical image analysis, typically evaluated using metrics like the Dice coefficient during training and validation. However, in clinical settings without manual annotations, assessing segmentation quality becomes challenging, and models lacking reliability indicators face adoption barriers. To address this gap, we propose a novel framework for predicting segmentation quality without requiring ground truth annotations during test time. Our approach introduces two complementary frameworks: one leveraging predicted segmentation and uncertainty maps, and another integrating the original input image, uncertainty maps, and predicted segmentation maps. We present Bayesian adaptations of two benchmark segmentation models-SwinUNet and Feature Pyramid Network with ResNet50-using Monte Carlo Dropout, Ensemble, and Test Time Augmentation to quantify uncertainty. We evaluate four uncertainty estimates: confidence map, entropy, mutual information, and expected pairwise Kullback-Leibler divergence on 2D skin lesion and 3D liver segmentation datasets, analyzing their correlation with segmentation quality metrics. Our framework achieves an R2 score of 93.25 and Pearson correlation of 96.58 on the HAM10000 dataset, outperforming previous segmentation quality assessment methods. For 3D liver segmentation, Test Time Augmentation with entropy achieves an R2 score of 85.03 and a Pearson correlation of 65.02, demonstrating cross-modality robustness. Additionally, we propose an aggregation strategy that combines multiple uncertainty estimates into a single score per image, offering a more robust and comprehensive assessment of segmentation quality. Finally, we use Grad-CAM and UMAP-based embedding analysis to interpret the model's behavior and reliability, highlighting the impact of uncertainty integration.
主题: 计算机视觉与模式识别 (cs.CV)
引用方式: arXiv:2508.01460 [cs.CV]
  (或者 arXiv:2508.01460v1 [cs.CV] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.01460
通过 DataCite 发表的 arXiv DOI
相关 DOI: https://doi.org/10.1016/j.compmedimag.2025.102547
链接到相关资源的 DOI

提交历史

来自: Sikha O K [查看电子邮件]
[v1] 星期六, 2025 年 8 月 2 日 18:30:32 UTC (31,217 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.CV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号