计算机科学 > 密码学与安全
[提交于 2024年7月3日
(v1)
,最后修订 2025年8月23日 (此版本, v2)]
标题: PII-Compass:通过接地引导LLM训练数据提取提示朝着目标PII
标题: PII-Compass: Guiding LLM training data extraction prompts towards the target PII via grounding
摘要: 最新且最具影响力的大型模型进展源于其规模的增加。 不幸的是,这转化为更强的记忆能力,引发了数据隐私问题。 具体来说,已经证明模型可以输出其训练数据中包含的个人可识别信息(PII)。 然而,报告的PII提取性能差异很大,对于评估此风险的最佳方法尚无共识,导致低估了现实中的对手。 在本工作中,我们实证表明,通过使用领域内数据对人工构建的提取提示的前缀进行定位,可以将PII的可提取性提高十倍以上。 我们的方法PII-Compass,在1、128和2308次查询的情况下,分别实现了0.92%、3.9%和6.86%的电话号码提取率,即每15人中就有1人的电话号码可以被提取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.