电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月28日
(v1)
,最后修订 2025年10月14日 (此版本, v3)]
标题: DINOv3在自然图像上的高效微调用于非典型分裂象分类(MIDOG 2025任务2优胜者)
标题: Efficient Fine-Tuning of DINOv3 Pretrained on Natural Images for Atypical Mitotic Figure Classification (MIDOG 2025 Task 2 Winner)
摘要: 非典型的有丝分裂图像(AMFs)代表与不良预后相关的异常细胞分裂。 然而,由于其发生率低、形态细微以及观察者之间的差异,其检测仍然困难。 MIDOG 2025挑战引入了一个跨多个领域的AMF分类基准。 在这项工作中,我们使用低秩适应(LoRA)对最近发布的DINOv3-H+视觉变压器进行了微调,该模型在自然图像上进行了预训练,仅训练约1.3M参数,并结合了广泛的增强和领域加权焦点损失,以处理领域异质性。 尽管存在领域差距,我们微调后的DINOv3能够有效地转移到组织病理学,最终测试集上取得了第一名。 这些结果突显了DINOv3预训练的优势,并强调了我们微调策略的高效性和鲁棒性,为MIDOG 2025中的非典型有丝分裂分类挑战提供了最先进的结果。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.