Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2509.13084

帮助 | 高级搜索

计算机科学 > 计算机视觉与模式识别

arXiv:2509.13084 (cs)
[提交于 2025年9月16日 ]

标题: 基于双网络的半监督医学图像分割的不确定性引导伪标签方法增强

标题: Enhancing Dual Network Based Semi-Supervised Medical Image Segmentation with Uncertainty-Guided Pseudo-Labeling

Authors:Yunyao Lu, Yihang Wu, Ahmad Chaddad, Tareef Daqqaq, Reem Kateb
摘要: 尽管监督医学图像分割模型表现出色,但在现实情况下依赖大量标记数据是不切实际的。半监督学习方法旨在通过伪标签生成利用未标记数据来缓解这一挑战。然而,现有的半监督分割方法仍然受到噪声伪标签和特征空间内监督不足的困扰。为了解决这些挑战,本文提出了一种基于双网络架构的新型半监督3D医学图像分割框架。具体而言,我们研究了一个交叉一致性增强模块,使用交叉伪标签和熵过滤监督来减少噪声伪标签,同时我们设计了一个动态加权策略,通过不确定性感知机制(即Kullback-Leibler散度)调整伪标签的贡献。此外,我们使用自监督对比学习机制,通过有效区分可信和不确定预测,将不确定体素特征与可靠类别原型对齐,从而减少预测不确定性。在三个3D分割数据集Left Atrial、NIH Pancreas和BraTS-2019上进行了广泛的实验。与最先进的方法相比,所提出的方法在各种设置下表现出优越的性能(例如,在Left Atrial数据集上使用10%标记数据时Dice得分为89.95%)。此外,通过消融实验进一步验证了所提出模块的有效性。
摘要: Despite the remarkable performance of supervised medical image segmentation models, relying on a large amount of labeled data is impractical in real-world situations. Semi-supervised learning approaches aim to alleviate this challenge using unlabeled data through pseudo-label generation. Yet, existing semi-supervised segmentation methods still suffer from noisy pseudo-labels and insufficient supervision within the feature space. To solve these challenges, this paper proposes a novel semi-supervised 3D medical image segmentation framework based on a dual-network architecture. Specifically, we investigate a Cross Consistency Enhancement module using both cross pseudo and entropy-filtered supervision to reduce the noisy pseudo-labels, while we design a dynamic weighting strategy to adjust the contributions of pseudo-labels using an uncertainty-aware mechanism (i.e., Kullback-Leibler divergence). In addition, we use a self-supervised contrastive learning mechanism to align uncertain voxel features with reliable class prototypes by effectively differentiating between trustworthy and uncertain predictions, thus reducing prediction uncertainty. Extensive experiments are conducted on three 3D segmentation datasets, Left Atrial, NIH Pancreas and BraTS-2019. The proposed approach consistently exhibits superior performance across various settings (e.g., 89.95\% Dice score on left Atrial with 10\% labeled data) compared to the state-of-the-art methods. Furthermore, the usefulness of the proposed modules is further validated via ablation experiments.
评论: 被接受于基于知识的系统
主题: 计算机视觉与模式识别 (cs.CV)
引用方式: arXiv:2509.13084 [cs.CV]
  (或者 arXiv:2509.13084v1 [cs.CV] 对于此版本)
  https://doi.org/10.48550/arXiv.2509.13084
通过 DataCite 发表的 arXiv DOI(待注册)
相关 DOI: https://doi.org/10.1016/j.knosys.2025.114454
链接到相关资源的 DOI

提交历史

来自: Yihang Wu [查看电子邮件]
[v1] 星期二, 2025 年 9 月 16 日 13:40:20 UTC (4,801 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.CV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-09
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号