Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess > arXiv:2508.20139

帮助 | 高级搜索

电气工程与系统科学 > 图像与视频处理

arXiv:2508.20139 (eess)
[提交于 2025年8月27日 ]

标题: 医学图像分割问题是否已解决? 当前发展与未来方向的综述

标题: Is the medical image segmentation problem solved? A survey of current developments and future directions

Authors:Guoping Xu, Jayaram K. Udupa, Jax Luo, Songlin Zhao, Yajun Yu, Scott B. Raymond, Hao Peng, Lipeng Ning, Yogesh Rathi, Wei Liu, You Zhang
摘要: 医学图像分割在过去二十年中迅速发展,主要由深度学习推动,这使得在多种成像模式下准确且高效地勾画细胞、组织、器官和病灶成为可能。 这一进展引发了一个基本问题:当前模型在多大程度上克服了持续的挑战,还存在哪些差距? 在本工作中,我们对医学图像分割进行了深入综述,追溯了过去十年的进展和关键发展。 我们考察了分割网络中编码器、瓶颈层、跳跃连接和解码器组件的核心原理,包括多尺度分析、注意力机制以及先验知识的整合。 我们的讨论围绕七个关键维度展开:(1) 从监督学习到半监督/无监督学习的转变, (2) 从器官分割到病灶聚焦任务的转变,(3) 多模态整合和领域适应的进步,(4) 基础模型和迁移学习的作用,(5) 从确定性分割到概率分割的转变,(6) 从2D到3D和4D分割的发展,以及(7) 从模型调用到分割代理的趋势。 这些视角共同提供了基于深度学习的医学图像分割发展轨迹的全面概述,并旨在激发未来的创新。 为了支持持续的研究,我们在 https://github.com/apple1986/medicalSegReview 维护一个不断更新的相关文献和开源资源库。
摘要: Medical image segmentation has advanced rapidly over the past two decades, largely driven by deep learning, which has enabled accurate and efficient delineation of cells, tissues, organs, and pathologies across diverse imaging modalities. This progress raises a fundamental question: to what extent have current models overcome persistent challenges, and what gaps remain? In this work, we provide an in-depth review of medical image segmentation, tracing its progress and key developments over the past decade. We examine core principles, including multiscale analysis, attention mechanisms, and the integration of prior knowledge, across the encoder, bottleneck, skip connections, and decoder components of segmentation networks. Our discussion is organized around seven key dimensions: (1) the shift from supervised to semi-/unsupervised learning, (2) the transition from organ segmentation to lesion-focused tasks, (3) advances in multi-modality integration and domain adaptation, (4) the role of foundation models and transfer learning, (5) the move from deterministic to probabilistic segmentation, (6) the progression from 2D to 3D and 4D segmentation, and (7) the trend from model invocation to segmentation agents. Together, these perspectives provide a holistic overview of the trajectory of deep learning-based medical image segmentation and aim to inspire future innovation. To support ongoing research, we maintain a continually updated repository of relevant literature and open-source resources at https://github.com/apple1986/medicalSegReview
评论: 80页,38图
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV); 人机交互 (cs.HC); 机器学习 (cs.LG)
引用方式: arXiv:2508.20139 [eess.IV]
  (或者 arXiv:2508.20139v1 [eess.IV] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.20139
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Guoping Xu [查看电子邮件]
[v1] 星期三, 2025 年 8 月 27 日 01:12:45 UTC (2,441 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
查看许可
当前浏览上下文:
eess.IV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs
cs.CV
cs.HC
cs.LG
eess

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号