统计学 > 方法论
[提交于 2019年8月11日
]
标题: 样本分割作为具有物理活动评分应用的M估计量
标题: Sample Splitting as an M-Estimator with Application to Physical Activity Scoring
摘要: 样本分割在统计应用中被广泛使用,包括在分类中的经典应用以及最近在模型选择后的推断。 受饮食、身体活动和健康研究中问题的启发,我们考虑了样本分割的新应用。 身体活动研究人员想要创建一个评分系统以快速评估身体活动水平。 该评分是通过一个大型队列研究创建的。 然后,使用相同的数据,该评分作为疾病或死亡风险模型中的协变量。 由于数据以这种方式被使用两次,拟合第二个模型的标准误差和置信区间无效。 为了进行正确的推断,可以使用样本分割。 一个人使用数据的一半来构建评分,然后在拟合另一部分数据的模型时使用该评分。 我们推导了估计量的极限分布。 一个明显的问题是如果进行多次样本分割会发生什么。 我们证明,随着样本分割次数的增加,多次样本分割的组合等价于求解一组估计方程。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.