电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月19日
]
标题: 腹部CT数据集现状:对偏差、临床相关性和现实适用性的批判性综述
标题: State of Abdominal CT Datasets: A Critical Review of Bias, Clinical Relevance, and Real-world Applicability
摘要: 这项系统综述对公开的腹部CT数据集进行了批判性评估,并分析了它们在临床环境中用于人工智能(AI)应用的适用性。 我们检查了46个公开的腹部CT数据集 (50,256项研究)。 在所有46个数据集中,我们发现存在大量冗余 (59.1% 的病例重复使用)和西方/地理偏倚(75.3% 来自北美和欧洲)。 对包含>=100例病例的19个数据集进行了偏差评估;在该子集中,最普遍的高风险类别是领域偏移(63%)和选择偏倚(57%),这两种情况都可能损害模型在不同医疗环境中的泛化能力——特别是在资源有限的环境中。 为了解决这些挑战,我们提出了针对数据集改进的目标策略,包括多机构合作、采用标准化协议以及有意识地纳入多样化的患者群体和成像技术。 这些努力对于支持开发更公平且临床稳健的腹部影像人工智能模型至关重要。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.