统计学 > 机器学习
            [提交于 2025年10月9日
            
            
            
            ]
          
          标题: 在对抗污染下的中位数-均值估计量的最优性
标题: On the Optimality of the Median-of-Means Estimator under Adversarial Contamination
摘要: 中位数-均值(MoM)是一种在机器学习中广泛使用的鲁棒估计器,已知在样本独立同分布的情况下是(最小最大)最优的。 在更严重的情况下,样本可能被一个可以检查和修改数据的对手所污染。 以前的工作已经从理论上证明了MoM估计器在某些污染环境中的适用性。 然而,MoM在对抗污染下的(最小最大)最优性和限制性在高斯情况之外仍不清楚。 在本文中,我们为对抗污染下MoM的误差提供了多个分布类别的上下界。 特别是,我们证明了在具有有限方差的分布类以及具有无限方差和有限绝对$(1+r)$-阶矩的分布类中,MoM是(最小最大)最优的。 我们还提供了与所提出的上界顺序匹配的MoM误差下界,并表明MoM对于轻尾分布是次优的。
文献和引用工具
与本文相关的代码,数据和媒体
            alphaXiv (什么是 alphaXiv?)
          
        
            CatalyzeX 代码查找器 (什么是 CatalyzeX?)
          
        
            DagsHub (什么是 DagsHub?)
          
        
            Gotit.pub (什么是 GotitPub?)
          
        
            Hugging Face (什么是 Huggingface?)
          
        
            带有代码的论文 (什么是带有代码的论文?)
          
        
            ScienceCast (什么是 ScienceCast?)
          
        演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.
 
               
  