电气工程与系统科学 > 图像与视频处理
            [提交于 2025年8月8日
            
            
            
            ]
          
          标题: 基于临床指导的数据合成用于喉部病变检测
标题: Clinically-guided Data Synthesis for Laryngeal Lesion Detection
摘要: 尽管计算机辅助诊断(CADx)和检测(CADe)系统在各个医学领域取得了显著进展,但它们在耳鼻喉科等专业领域中的应用仍然有限。 在后者中,当前的评估方法高度依赖于操作者的专业知识,病变的高异质性使诊断变得复杂,尽管活检仍然是金标准,但其成本和风险都很高。 对于专业的内窥镜CADx/e系统来说,一个关键瓶颈是缺乏具有足够变异性以实现现实世界泛化的良好标注数据集。 本研究介绍了一种新方法,该方法利用潜在扩散模型(LDM)结合ControlNet适配器,根据临床观察生成喉内窥镜图像-标注对。 该方法通过将扩散过程条件化,生成具有现实感、高质量和临床相关性的图像特征,从而解决数据稀缺问题,这些特征能够捕捉多种解剖状况。 所提出的方法可以用于扩展CADx/e模型的训练数据集,增强喉科学的评估过程。 事实上,在下游检测任务中,仅添加10%的合成数据就使模型内部测试时的喉部病变检测率提高了9%,在跨域外部数据上的检测率提高了22.1%。 此外,通过让5名不同专业水平的耳鼻喉科专家对合成图像与真实图像的区分信心进行评分,评估了生成图像的真实性。 这项工作有望加速喉部疾病诊断自动化工具的发展,提供一种解决数据稀缺问题的方案,并展示了合成数据在现实场景中的适用性。
文献和引用工具
与本文相关的代码,数据和媒体
            alphaXiv (什么是 alphaXiv?)
          
        
            CatalyzeX 代码查找器 (什么是 CatalyzeX?)
          
        
            DagsHub (什么是 DagsHub?)
          
        
            Gotit.pub (什么是 GotitPub?)
          
        
            Hugging Face (什么是 Huggingface?)
          
        
            带有代码的论文 (什么是带有代码的论文?)
          
        
            ScienceCast (什么是 ScienceCast?)
          
        演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.
 
  