计算机科学 > 信息检索
[提交于 2025年8月5日
]
标题: 多源检索增强生成中的幻觉缓解知识引导框架MultiRAG
标题: MultiRAG: A Knowledge-guided Framework for Mitigating Hallucination in Multi-source Retrieval Augmented Generation
摘要: 检索增强生成(RAG)已成为解决大型语言模型(LLMs)中幻觉问题的有前景的方案。 然而,整合多个检索源虽然可能更具有信息量,但会引入新的挑战,这些挑战可能会悖论性地加剧幻觉问题。 这些挑战主要体现在两个方面:多源数据的稀疏分布阻碍了逻辑关系的捕捉,以及不同源之间的固有不一致性导致信息冲突。 为了解决这些问题,我们提出了MultiRAG,这是一种新颖的框架,旨在通过知识引导的方法减轻多源检索增强生成中的幻觉问题。 我们的框架引入了两项关键创新:(1)一个知识构建模块,采用多源线图来高效聚合不同知识源之间的逻辑关系,有效解决数据分布稀疏的问题;(2)一个复杂的检索模块,实现了多级置信度计算机制,在图级别和节点级别进行评估,以识别并消除不可靠的信息节点,从而减少由源间不一致引起的幻觉。 在四个多领域查询数据集和两个多跳问答数据集上的大量实验表明,MultiRAG显著提高了复杂多源场景下知识检索的可靠性和效率。 \textcolor{blue}\{我们的代码可在 https://github.com/wuwenlong123/MultiRAG 获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.