Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > math > arXiv:1708.06077

帮助 | 高级搜索

数学 > 统计理论

arXiv:1708.06077 (math)
[提交于 2017年8月21日 (v1) ,最后修订 2020年7月4日 (此版本, v2)]

标题: 扩展的Sure独立筛选法ExSIS用于超高维线性模型

标题: ExSIS: Extended Sure Independence Screening for Ultrahigh-dimensional Linear Models

Authors:Talal Ahmed, Waheed U. Bajwa
摘要: 在超高维线性模型中,统计推断可能在计算上难以实现。基于相关性的变量筛选方法,即利用边缘相关性在统计推断之前从模型中移除无关变量,可以用来克服这一挑战。以往关于基于相关性的变量筛选的工作要么对线性模型施加统计先验,要么假设特定的筛选后推断方法。本文首先将基于相关性的变量筛选分析扩展到任意线性模型和筛选后的推断技术。 具体而言,(i) 它表明一个条件——称为筛选条件——对于成功地基于相关性筛选线性模型来说是充分的,并且(ii) 它提供了对基于边缘相关性筛选与不同问题参数之间依赖关系的见解。 数值实验确认了这些见解不仅仅是分析的产物;相反,它们反映了与基于边缘相关性变量筛选相关的挑战。 其次,本文明确推导了任意(随机或确定性)线性模型的筛选条件,在此过程中,它证明了——在适当条件下——即使活跃变量的数量几乎线性增长到样本大小时,也可以将超高维任意线性模型的维度减少到接近样本大小。 第三,它将筛选条件专门化为次高斯线性模型,并将最终结果与文献中现有的结果进行对比。 这种专门化正式验证了本文的主要结果概括了现有基于相关性的筛选结果的主张。
摘要: Statistical inference can be computationally prohibitive in ultrahigh-dimensional linear models. Correlation-based variable screening, in which one leverages marginal correlations for removal of irrelevant variables from the model prior to statistical inference, can be used to overcome this challenge. Prior works on correlation-based variable screening either impose statistical priors on the linear model or assume specific post-screening inference methods. This paper first extends the analysis of correlation-based variable screening to arbitrary linear models and post-screening inference techniques. In particular, (i) it shows that a condition---termed the screening condition---is sufficient for successful correlation-based screening of linear models, and (ii) it provides insights into the dependence of marginal correlation-based screening on different problem parameters. Numerical experiments confirm that these insights are not mere artifacts of analysis; rather, they are reflective of the challenges associated with marginal correlation-based variable screening. Second, the paper explicitly derives the screening condition for arbitrary (random or deterministic) linear models and, in the process, it establishes that---under appropriate conditions---it is possible to reduce the dimension of an ultrahigh-dimensional, arbitrary linear model to almost the sample size even when the number of active variables scales almost linearly with the sample size. Third, it specializes the screening condition to sub-Gaussian linear models and contrasts the final results to those existing in the literature. This specialization formally validates the claim that the main result of this paper generalizes existing ones on correlation-based screening.
评论: 30页;3个图和1个表格;期刊论文预印本
主题: 统计理论 (math.ST) ; 信息论 (cs.IT); 机器学习 (stat.ML)
引用方式: arXiv:1708.06077 [math.ST]
  (或者 arXiv:1708.06077v2 [math.ST] 对于此版本)
  https://doi.org/10.48550/arXiv.1708.06077
通过 DataCite 发表的 arXiv DOI
期刊参考: EURASIP J. Signal Processing, vol. 159, pp. 33-48, Jun. 2019
相关 DOI: https://doi.org/10.1016/j.sigpro.2019.01.018
链接到相关资源的 DOI

提交历史

来自: Waheed Bajwa [查看电子邮件]
[v1] 星期一, 2017 年 8 月 21 日 03:41:14 UTC (49 KB)
[v2] 星期六, 2020 年 7 月 4 日 18:48:20 UTC (78 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
math.ST
< 上一篇   |   下一篇 >
新的 | 最近的 | 2017-08
切换浏览方式为:
cs
cs.IT
math
math.IT
stat
stat.ML
stat.TH

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号