统计学 > 方法论
[提交于 2026年1月29日
]
标题: 神经 Wasserstein 两样本检验
标题: Neural Wasserstein Two-Sample Tests
摘要: 两样本同质性检验问题在统计学中是基础性的,在高维情况下尤其具有挑战性,其中经典检验可能会出现显著的效力损失。 我们开发了一种基于投影1-Wasserstein距离的学习辅助过程,我们称之为神经Wasserstein检验。 该方法的提出是基于这样一个观察:通常存在一个低维投影,使得两个高维分布在此投影下有所差异。 在实际操作中,我们通过流形优化和使用深度神经网络的见证函数来学习投影方向。 为了适应未知的投影维度和稀疏水平,我们通过一种最大值型构造对一组候选统计量进行聚合,避免了显式的调参,同时可能提高效力。 我们建立了所提出检验的有效性和一致性,并证明了高斯近似的Berry--Esseen型界。 特别是,在原假设下,聚合统计量收敛于标准高斯向量的绝对最大值,从而得到一种渐近枢轴(分布无关)的校准方法,避免了重采样。 模拟研究和一个真实数据例子展示了所提出方法的强大有限样本性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.