统计学 > 应用
[提交于 2012年6月28日
]
标题: 使用可解释的回归树模型分析建立非响应情况与链接行政数据的分析
标题: Analyzing establishment nonresponse using an interpretable regression tree model with linked administrative data
摘要: 为了深入了解机构的特征如何与无应答相关联,应用了一个递归划分算法,对2006年5月职业就业统计数据调查数据进行分析,以构建一个回归树。 该树模型根据某些机构特征,模拟机构对调查的应答倾向。 它基于特征生成互斥的单元格,这些单元格具有同质的应答倾向。 这使得很容易识别特征变量与机构应答倾向之间的可解释关联,而使用逻辑回归倾向模型则不容易做到这一点。 我们使用5月的数据获得的模型,对其进行了2006年11月职业就业统计数据调查数据的测试。 在具有非常大的样本量$(n=179,360)$的独立机构数据集上测试该模型,提供了证据表明回归树模型准确描述了机构特征与OES调查应答倾向之间的关联。 通过模拟将这种建模方法的准确性与逻辑回归进行了比较。 然后,该表示方法结合了与样本数据链接的框架级行政工资数据,用于研究无应答偏差的可能性。 我们表明,如果没有适当的调整,无应答确实可能带来偏差风险,并且可能是不可忽略的。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.