统计学 > 方法论
[提交于 2025年10月13日
]
标题: 两阶段研究的最优两步估计方法
标题: An optimal two-step estimation approach for two-phase studies
摘要: 两阶段抽样常用于降低成本并提高估计效率。 在许多两阶段研究中,结果变量和一些低成本的协变量在第一阶段对大样本进行观测,而在第二阶段对样本的选定子集获取昂贵的协变量。 因此,分析结果变量与协变量之间的关联面临缺失数据问题。 仅依赖第二阶段样本的完整案例分析通常效率较低。 在本文中,我们研究了一种两步估计方法,该方法首先使用完整数据获得一个估计量,然后利用从结果变量与低成本协变量之间的工作模型中得到的渐近均值为零的估计量,使用完整数据对其进行更新。 这种两步估计量在渐近意义上至少与完整数据估计量一样有效,并且对工作模型的误设具有鲁棒性。 我们提出了一种基于核的方法来构建达到最优效率的两步估计量。 此外,当完全非参数核方法不可行时,我们开发了一种基于多个工作模型的简单联合更新方法来近似最优估计量。 我们通过各种结果模型说明了所提出的方法。 我们通过模拟研究展示了它们相对于现有方法的优势,并提供了一个主要癌症基因组学研究的应用实例。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.