统计学 > 方法论
[提交于 2025年10月15日
]
标题: $φ$-PCA 框架:一种统一且保持效率的方法及鲁棒变体
标题: The $φ$-PCA Framework: A Unified and Efficiency-Preserving Approach with Robust Variants
摘要: 主成分分析(PCA)是多元统计中的基本工具,但其对异常值的敏感性和在分布式环境中的局限性限制了其在现代大规模应用中的有效性。 为解决这些挑战,我们引入了$\phi$-PCA框架,该框架提供了稳健和分布式PCA的统一公式。 $\phi$-PCA方法类保留了标准PCA的渐近效率,同时通过使用适当的$\phi$函数聚合多个局部估计,增强了顺序鲁棒性,从而在污染条件下实现了更精确的特征子空间估计。 值得注意的是,调和均值PCA(HM-PCA),对应于选择$\phi(u)=u^{-1}$,实现了最优的顺序鲁棒性,推荐用于实际应用。 理论结果进一步表明,鲁棒性随着分区数量的增加而提高,这一现象在稳健或分布式PCA的文献中很少被探讨。 总体而言,$\phi$-PCA所依据的分区分聚原则为开发适用于稳健和分布式数据分析的稳健且保持效率的方法提供了通用策略。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.