Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > math > arXiv:2510.14055

帮助 | 高级搜索

数学 > 统计理论

arXiv:2510.14055 (math)
[提交于 2025年10月15日 (v1) ,最后修订 2025年10月23日 (此版本, v2)]

标题: 复杂调查设计的最小Hellinger距离估计量

标题: Minimum Hellinger Distance Estimators for Complex Survey Designs

Authors:David Kepplinger, Anand N. Vidyashankar
摘要: 从复杂调查样本中得出可靠的推断可能会受到异常值和高杠杆观测值的干扰,这些异常值和高杠杆观测值是由不等的纳入概率和校准引起的。 我们开发了一种最小Hellinger距离估计量(MHDE),用于复杂设计下的参数超总体模型,包括泊松PPS和固定大小的SRS/PPS无放回抽样,可能具有随机后分层或校准权重。 使用一个Horvitz-Thompson调整的核密度插值,我们证明了:(i) KDE的$L^1$-一致性,具有由方差自适应有效样本量驱动的显式大偏差尾部界限;(ii) Hellinger相似性的均匀指数界限,这在较弱的可识别性条件下产生MHDE的一致性;(iii) MHDE的渐近正态分布,协方差为$\mathbf A^{-1}\boldsymbol\Sigma \mathbf A^{\intercal}$(在无放回设计下有有限总体修正);以及(iv) 通过Hellinger拓扑中的影响函数和$\alpha$-影响曲线实现稳健性。 在Gamma和对数正态超总体模型下的模拟量化了相对于独立和高杠杆污染下加权MLE的效率-稳健性权衡。 对NHANES 2021-2023总水分摄入的应用表明,尽管存在极端响应,MHDE仍然保持稳定,而MLE则明显被偏差。 该估计量可以通过在固定网格上进行数值积分来简单实现,并且可以扩展到其他散度族。
摘要: Reliable inference from complex survey samples can be derailed by outliers and high-leverage observations induced by unequal inclusion probabilities and calibration. We develop a minimum Hellinger distance estimator (MHDE) for parametric superpopulation models under complex designs, including Poisson PPS and fixed-size SRS/PPS without replacement, with possibly stochastic post-stratified or calibrated weights. Using a Horvitz-Thompson-adjusted kernel density plug-in, we show: (i) $L^1$-consistency of the KDE with explicit large-deviation tail bounds driven by a variance-adaptive effective sample size; (ii) uniform exponential bounds for the Hellinger affinity that yield MHDE consistency under mild identifiability; (iii) an asymptotic Normal distribution for the MHDE with covariance $\mathbf A^{-1}\boldsymbol\Sigma \mathbf A^{\intercal}$ (and a finite-population correction under without-replacement designs); and (iv) robustness via the influence function and $\alpha$-influence curves in the Hellinger topology. Simulations under Gamma and lognormal superpopulation models quantify efficiency-robustness trade-offs relative to weighted MLE under independent and high-leverage contamination. An application to NHANES 2021-2023 total water consumption shows that the MHDE remains stable despite extreme responses that markedly bias the MLE. The estimator is simple to implement via quadrature over a fixed grid and is extensible to other divergence families.
评论: 36页
主题: 统计理论 (math.ST) ; 信息论 (cs.IT); 概率 (math.PR)
ACM 类: G.3
引用方式: arXiv:2510.14055 [math.ST]
  (或者 arXiv:2510.14055v2 [math.ST] 对于此版本)
  https://doi.org/10.48550/arXiv.2510.14055
通过 DataCite 发表的 arXiv DOI

提交历史

来自: David Kepplinger [查看电子邮件]
[v1] 星期三, 2025 年 10 月 15 日 19:47:56 UTC (277 KB)
[v2] 星期四, 2025 年 10 月 23 日 19:38:04 UTC (277 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
math.ST
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-10
切换浏览方式为:
cs
cs.IT
math
math.IT
math.PR
stat
stat.TH

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号