电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月26日
]
标题: 针对PET-CT肿瘤分割的3D nnU-Net的跨癌症泛化能力的压力测试:使用新的食管癌和肺癌数据集的多队列评估
标题: Stress-testing cross-cancer generalizability of 3D nnU-Net for PET-CT tumor segmentation: multi-cohort evaluation with novel oesophageal and lung cancer datasets
摘要: 鲁棒的泛化对于在临床PET-CT工作流程中部署基于深度学习的肿瘤分割至关重要,其中解剖部位、扫描仪和患者群体存在广泛变化。 本研究首次对PET-CT上的nnU-Net进行了跨癌症评估,并引入了两个新颖的专家标注的全身数据集。 279名食管癌患者(澳大利亚队列)和54名肺癌患者(印度队列)。 这些队列补充了公共AutoPET数据集,并实现了跨领域性能的系统性压力测试。 我们在三种范式下训练和测试了3D nnUNet模型。 仅目标(食管)、仅公共(AutoPET)和联合训练。 对于测试集,仅食管模型在内部域准确性方面表现最佳(平均DSC,57.8),但在外部印度肺癌队列上失败(平均DSC低于3.4),表明存在严重的过拟合。 仅公共模型泛化范围更广(在AutoPET上平均DSC为63.5,在印度肺癌队列上平均DSC为51.6),但在食管澳大利亚队列中表现不佳(平均DSC为26.7)。 联合方法提供了最平衡的结果(平均DSC,肺癌(52.9),食管(40.7),AutoPET(60.9)),减少了边界错误并在所有队列中提高了鲁棒性。 这些发现表明,数据集多样性,特别是多人口统计、多中心和多癌症整合,比架构新颖性更能推动鲁棒的泛化。 这项工作提出了基于人口统计的跨癌症深度学习分割评估,并强调数据集多样性,而不是模型复杂性,是临床鲁棒分割的基础。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.