统计学 > 方法论
[提交于 2014年9月5日
]
标题: 关于大样本数据的最优多重变点算法
标题: On Optimal Multiple Changepoint Algorithms for Large Data
摘要: 对于能够准确检测长时间序列或多等效数据中的变化点的需求日益增加。 许多常见的变化点检测方法(例如基于惩罚似然或最小描述长度的方法)都可以表述为最小化分段的成本函数。 存在精确解决此最小化问题的动态规划方法,但这些方法通常在时间序列长度上至少呈二次增长。 存在计算成本接近线性的时间序列长度的算法(例如二分分割),但它们无法保证找到最优分段。 最近提出了加速动态规划算法的想法,同时仍能保证找到成本函数的真实最小值。 在这里,我们扩展了这些剪枝方法,并引入了两种用于分割数据的新算法:FPOP 和 SNIP。 经验结果显示,FPOP 比现有的动态规划方法快得多,并且与现有方法不同,其计算效率不受数据中变化点数量的影响。 我们评估了该方法在检测拷贝数变异方面的性能,并观察到 FPOP 的计算成本与二分分割法具有竞争力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.