Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2508.03553

帮助 | 高级搜索

计算机科学 > 信息检索

arXiv:2508.03553 (cs)
[提交于 2025年8月5日 ]

标题: 多源检索增强生成中的幻觉缓解知识引导框架MultiRAG

标题: MultiRAG: A Knowledge-guided Framework for Mitigating Hallucination in Multi-source Retrieval Augmented Generation

Authors:Wenlong Wu, Haofen Wang, Bohan Li, Peixuan Huang, Xinzhe Zhao, Lei Liang
摘要: 检索增强生成(RAG)已成为解决大型语言模型(LLMs)中幻觉问题的有前景的方案。 然而,整合多个检索源虽然可能更具有信息量,但会引入新的挑战,这些挑战可能会悖论性地加剧幻觉问题。 这些挑战主要体现在两个方面:多源数据的稀疏分布阻碍了逻辑关系的捕捉,以及不同源之间的固有不一致性导致信息冲突。 为了解决这些问题,我们提出了MultiRAG,这是一种新颖的框架,旨在通过知识引导的方法减轻多源检索增强生成中的幻觉问题。 我们的框架引入了两项关键创新:(1)一个知识构建模块,采用多源线图来高效聚合不同知识源之间的逻辑关系,有效解决数据分布稀疏的问题;(2)一个复杂的检索模块,实现了多级置信度计算机制,在图级别和节点级别进行评估,以识别并消除不可靠的信息节点,从而减少由源间不一致引起的幻觉。 在四个多领域查询数据集和两个多跳问答数据集上的大量实验表明,MultiRAG显著提高了复杂多源场景下知识检索的可靠性和效率。 \textcolor{blue}\{我们的代码可在 https://github.com/wuwenlong123/MultiRAG 获取。
摘要: Retrieval Augmented Generation (RAG) has emerged as a promising solution to address hallucination issues in Large Language Models (LLMs). However, the integration of multiple retrieval sources, while potentially more informative, introduces new challenges that can paradoxically exacerbate hallucination problems. These challenges manifest primarily in two aspects: the sparse distribution of multi-source data that hinders the capture of logical relationships and the inherent inconsistencies among different sources that lead to information conflicts. To address these challenges, we propose MultiRAG, a novel framework designed to mitigate hallucination in multi-source retrieval-augmented generation through knowledge-guided approaches. Our framework introduces two key innovations: (1) a knowledge construction module that employs multi-source line graphs to efficiently aggregate logical relationships across different knowledge sources, effectively addressing the sparse data distribution issue; and (2) a sophisticated retrieval module that implements a multi-level confidence calculation mechanism, performing both graph-level and node-level assessments to identify and eliminate unreliable information nodes, thereby reducing hallucinations caused by inter-source inconsistencies. Extensive experiments on four multi-domain query datasets and two multi-hop QA datasets demonstrate that MultiRAG significantly enhances the reliability and efficiency of knowledge retrieval in complex multi-source scenarios. \textcolor{blue}{Our code is available in https://github.com/wuwenlong123/MultiRAG.
评论: 被ICDE 2025收录的研究论文
主题: 信息检索 (cs.IR) ; 计算与语言 (cs.CL)
引用方式: arXiv:2508.03553 [cs.IR]
  (或者 arXiv:2508.03553v1 [cs.IR] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.03553
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Wu Wenlong [查看电子邮件]
[v1] 星期二, 2025 年 8 月 5 日 15:20:52 UTC (2,314 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.IR
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs
cs.CL

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号