计算机科学 > 机器学习
[提交于 2020年6月18日
(v1)
,最后修订 2021年5月20日 (此版本, v2)]
标题: 注意黑盒:对最近防御对抗样本鲁棒性的研究
标题: Beware the Black-Box: on the Robustness of Recent Defenses to Adversarial Examples
摘要: 许多防御方法最近在NIPS、ICML、ICLR和CVPR等会议上被提出。 这些防御主要集中在缓解白盒攻击上。 它们没有正确检查黑盒攻击。 在本文中,我们将这些防御的分析扩展到包括适应性黑盒对手。 我们的评估包括Barrage of Random Transforms、ComDefend、Ensemble Diversity、Feature Distillation、The Odds are Odd、Error Correcting Codes、Distribution Classifier Defense、K-Winner Take All和Buffer Zones在内的九种防御方法。 我们的研究使用了两种黑盒对抗模型和针对CIFAR-10和Fashion-MNIST数据集的六种广泛研究的对抗攻击。 我们的分析显示,大多数最新防御(9种中的7种)与未受保护的网络相比,安全性的提升仅是有限的($<25\%$)。 对于每种防御,我们还展示了对手可用的数据量与其适应性黑盒攻击效果之间的关系。 总体而言,我们的结果呈现出一个清晰的画面:为了被认为是安全的,防御需要进行彻底的白盒和黑盒分析。 我们提供了这项大规模的研究和分析,以促使该领域朝着开发更强大的黑盒防御方向发展。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.