计算机科学 > 信息检索
[提交于 2025年10月8日
]
标题: M3Retrieve:医学多模态检索基准测试
标题: M3Retrieve: Benchmarking Multimodal Retrieval for Medicine
摘要: 随着检索增强生成(RAG)的日益广泛应用,强大的检索模型比以往任何时候都更加重要。在医疗领域,结合文本和图像信息的多模态检索模型在许多下游任务中具有重大优势,例如问答、跨模态检索和多模态摘要,因为医疗数据通常包含这两种格式。然而,目前尚无标准基准来评估这些模型在医疗环境中的表现。为解决这一差距,我们引入了M3Retrieve,这是一个多模态医学检索基准。M3Retrieve涵盖5个领域、16个医学领域和4项不同的任务,包含超过120万篇文本文档和16.4万个多模态查询,所有数据均在获得批准的许可下收集。我们在该基准上评估领先的多模态检索模型,以探索不同医学专科特有的挑战,并了解它们对检索性能的影响。通过发布M3Retrieve,我们的目标是实现系统评估,促进模型创新,并加速构建更强大且可靠的多模态检索系统用于医疗应用。该数据集和基线代码可在以下github页面获取https://github.com/AkashGhosh/M3Retrieve.
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.