统计学 > 应用
[提交于 2025年10月27日
]
标题: 超越权衡曲线:用于评估匿名化和合成数据的多变量和高级风险-效用图
标题: Beyond the Trade-off Curve: Multivariate and Advanced Risk-Utility Maps for Evaluating Anonymized and Synthetic Data
摘要: 对微观数据进行匿名化需要在降低披露风险和保持数据效用之间取得平衡。 传统的评估方法通常依赖于单一指标或二维的风险-效用(R-U)图,但现实世界的评估涉及多个相互关联的风险和效用指标。 这些指标的成对比较可能效率低下且不完整。 因此,我们系统地比较了六种可视化方法,以同时评估多个风险和效用指标:热图、点图、复合散点图、平行坐标图、径向轮廓图和基于主成分分析的双标图。 我们引入了分块主成分分析用于复合散点图,以及联合主成分分析用于双标图,这些方法能够同时揭示方法性能和指标之间的关系。 通过在所有方法中系统地识别帕累托最优方法,我们展示了多变量可视化如何支持更明智的匿名化方法选择。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.