电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月19日
]
标题: 压力下的像素:探索高分辨率医学影像中基础模型的微调范式
标题: Pixels Under Pressure: Exploring Fine-Tuning Paradigms for Foundation Models in High-Resolution Medical Imaging
摘要: 基于扩散的基础模型的进展提高了文本到图像的生成,但大多数努力仅限于低分辨率设置。 随着高分辨率图像合成在各种应用中变得越来越重要,特别是在医学成像领域,微调成为适应这些强大的预训练模型以满足特定任务需求和数据分布的关键机制。 在本工作中,我们进行了一项系统研究,考察在扩展到高分辨率512x512像素时,各种微调技术对图像生成质量的影响。 我们基准测试了一组多样化的微调方法,包括完整的微调策略和参数高效的微调(PEFT)。 我们分析了不同的微调方法如何影响关键质量指标,包括Fréchet Inception Distance(FID)、Vendi分数和提示图像对齐。 我们还评估了在数据稀缺条件下生成图像在下游分类任务中的实用性,结果表明,当使用合成图像进行分类器训练和在真实图像上进行评估时,特定的微调策略可以提高生成保真度和下游性能。 我们的代码可通过项目网站获取 - https://tehraninasab.github.io/PixelUPressure/.
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.