计算机科学 > 信息检索
[提交于 2025年10月2日
]
标题: 重新审视查询变体:检索相对于生成查询变体在有效QPP中的优势
标题: Revisiting Query Variants: The Advantage of Retrieval Over Generation of Query Variants for Effective QPP
摘要: 利用查询变体(QVs),即与目标查询可能具有相似信息需求的查询,已被证明可以提高查询性能预测(QPP)方法的效果。 现有的基于QV的QPP方法通过查询扩展或非上下文嵌入生成QVs,这可能会引入主题漂移和幻觉。 在本文中,我们提出了一种方法,针对给定的QPP目标查询,从训练集(例如MS MARCO)中检索QVs。 为了从训练集中检索出与目标查询信息需求最相似的查询以实现高召回率,我们通过使用其指定的相关文档进行第二次检索来扩展直接检索到的QVs(1跳QVs),从而得到2跳QVs。 我们的实验在TREC DL'19和DL'20上进行,结果表明,使用我们方法检索到QVs的QPP方法,在像MonoT5这样的神经排序模型上,比现有表现最好的生成QV-based QPP方法提高了多达约20%。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.