计算机科学 > 密码学与安全
[提交于 2025年9月30日
]
标题: MAVUL:通过上下文推理和交互式优化进行多智能体漏洞检测
标题: MAVUL: Multi-Agent Vulnerability Detection via Contextual Reasoning and Interactive Refinement
摘要: 开放源代码软件(OSS)的广泛采用需要减轻漏洞风险。 大多数漏洞检测(VD)方法由于缺乏上下文理解、限制性的单轮交互和粗粒度评估而受到限制,导致模型性能不佳和评估结果偏差。 为了解决这些挑战,我们提出了MAVUL,一种新颖的多代理VD系统,该系统整合了上下文推理和交互式优化。 具体而言,设计了一个漏洞分析师代理,以灵活地利用工具使用能力和上下文推理,实现跨过程代码理解和有效挖掘漏洞模式。 通过在跨角色代理交互中的迭代反馈和优化决策,系统实现了可靠的推理和漏洞预测。 此外,MAVUL引入了多维真实信息用于细粒度评估,从而提高了评估的准确性和可靠性。 在成对漏洞数据集上进行的大量实验表明MAVUL表现出色。 我们的研究结果表明,MAVUL显著优于现有的多代理系统,成对准确率高出超过62%,比单代理系统平均性能高出超过600%。 随着漏洞分析师代理和安全架构师代理之间通信轮次的增加,系统的有效性明显提高,这突显了在追踪漏洞流中上下文推理的重要性以及关键反馈作用。 此外,集成的评估代理作为一个关键且无偏的裁判,通过防止误导性的二元比较,确保了系统实际应用的更准确和可靠估计。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.