数学 > 统计理论
[提交于 2025年10月8日
]
标题: 一种基于伯恩斯坦多项式的估计方法,在存在缺失数据的情况下用于累积分布函数的估计
标题: A Bernstein polynomial approach for the estimation of cumulative distribution functions in the presence of missing data
摘要: 我们研究了数据随机缺失情况下单变量累积分布函数(CDF)的非参数估计。 所提出的估计量通过伯恩斯坦算子平滑逆概率加权(IPW)经验CDF,产生单调的、取值为$[0,1]$的曲线,这些曲线能够自动适应有界支撑。 我们分析了两种版本:一种是使用已知倾向性的伪估计量,另一种是使用从离散辅助变量中非参数估计的倾向性的可行估计量,后者在实践中更为常见。 对于这两种估计量,我们推导了逐点偏差和方差展开式,建立了相对于均方误差的最优多项式次数$m$,并证明了渐近正态性。 一个关键发现是,可行估计量的方差比伪估计量小一个显式的非负修正项。 我们还通过最小二乘交叉验证开发了一个高效的次数选择过程。 蒙特卡罗实验表明,对于中等至较大的样本量,伯恩斯坦平滑的可行估计量在相同情境下优于其未平滑的对应项以及Dubnicka(2009)提出的IPW核密度估计器的集成版本。 对2017-2018年国家健康与营养检查调查(NHANES)中空腹血糖数据的实际数据分析展示了该方法在实际场景中的应用。 所有用于重现我们分析的代码均可在GitHub上轻松获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.