计算机科学 > 计算机与社会
[提交于 2018年8月1日
]
标题: 移动电话数据在发展中的隐私-效用权衡映射
标题: Mapping the Privacy-Utility Tradeoff in Mobile Phone Data for Development
摘要: 当今的数据时代具有很高的潜力,可以提升我们在发展和人道主义行动领域追求和监测进展的方式。 我们研究大规模行为数据中数据效用与隐私风险之间的关系,重点关注手机元数据作为典型领域。 为了衡量效用,我们调查了专家在不同空间和时间粒度级别下对手机元数据价值的看法。 为了衡量隐私,我们提出了一种形式化且直观的重新识别风险度量$\unicode{x2014}$信息比率$\unicode{x2014}$并在每个粒度级别上计算它。 我们的结果证实了数据效用与重新识别性之间存在明显的权衡,其中最有价值的数据集也最容易被重新识别。 当数据指定到邮编和小时级别时,仅需了解一个人数据的7%,即可完成重新识别并检索剩余的93%。 相比之下,在最有价值的数据集中,指定到市和每日级别时,平均需要了解一个人数据的51%,即31个数据点,才能检索剩余的49%。 总体而言,我们的发现表明,数据粗化会直接降低其价值,并强调需要将数据粗化与提供可调整的责任和安全程度的数据共享模型结合使用,而不是作为独立机制。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.