电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月22日
]
标题: 一种针对肾癌精准肿瘤学的疾病导向视觉-语言基础模型
标题: A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer
摘要: 非侵入性评估日益发现的肾部肿块是泌尿肿瘤学中的一个关键挑战,其中诊断不确定性经常导致对良性或惰性肿瘤的过度治疗。 在本研究中,我们使用来自九家中国医疗中心和公共TCIA队列的8,809名患者的27,866张CT扫描数据集,开发并验证了RenalCLIP,这是一个用于肾部肿块表征、诊断和预后的视觉-语言基础模型。 该模型通过一种两阶段的预训练策略进行开发,首先通过领域特定知识增强图像和文本编码器,然后通过对比学习目标对齐它们,以创建具有强大泛化能力和诊断精度的表示。 与其它最先进的通用CT基础模型相比,RenalCLIP在涵盖肾脏癌完整临床工作流程的10个核心任务中表现出更好的性能和优越的泛化能力,包括解剖评估、诊断分类和生存预测。 特别是对于TCIA队列中复杂的任务,如无复发生存预测,RenalCLIP达到了0.726的C指数,比领先的基线模型提高了约20%。 此外,RenalCLIP的预训练显著提高了数据效率;在诊断分类任务中,它仅需要20%的训练数据就能达到所有基线模型的峰值性能,即使这些模型在100%的数据上进行了充分微调。 此外,它在报告生成、图像-文本检索和零样本诊断任务中也表现出优越的性能。 我们的研究结果表明,RenalCLIP提供了一个强大的工具,有望提高诊断准确性,优化预后分层,并个性化管理肾癌患者。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.