统计学 > 方法论
[提交于 2025年10月27日
]
标题: 非参数识别和估计偏好抽样下的多类别均值比
标题: Nonparametric Identification and Estimation of Ratios of Multi-Category Means under Preferential Sampling
摘要: 多类别数据出现在多个领域,包括市场营销、化学、公共政策、基因组学、政治科学和生态学。 我们考虑在完全非参数设置下估计特定类别的均值比率的问题,允许观测单元和类别被选择性抽样。 我们考虑了协变量调整和未调整的估计量,这些估计量是非参数定义的,且易于解释。 虽然通过参数分布或对条件均值的限制(例如,对数线性)已经建立了相关模型的可识别性,但我们表明,可以通过独立性假设或类别约束(如参考类别或中心化函数)获得可识别性。 我们开发了一种高效、双重稳健的目标最小损失估计器,具有出色的有限样本性能,包括在大量不常观察到的类别情况下。 我们通过模拟对比了我们方法与相关方法的性能,并将其应用于识别在腹泻病例中与对照组相比差异丰富的细菌。 我们的工作提供了一个通用框架,用于研究组成数据设置中的参数可识别性,而无需对数据分布做出参数假设。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.