Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:1409.1842

帮助 | 高级搜索

统计学 > 方法论

arXiv:1409.1842 (stat)
[提交于 2014年9月5日 ]

标题: 关于大样本数据的最优多重变点算法

标题: On Optimal Multiple Changepoint Algorithms for Large Data

Authors:Robert Maidstone, Toby Hocking, Guillem Rigaill, Paul Fearnhead
摘要: 对于能够准确检测长时间序列或多等效数据中的变化点的需求日益增加。 许多常见的变化点检测方法(例如基于惩罚似然或最小描述长度的方法)都可以表述为最小化分段的成本函数。 存在精确解决此最小化问题的动态规划方法,但这些方法通常在时间序列长度上至少呈二次增长。 存在计算成本接近线性的时间序列长度的算法(例如二分分割),但它们无法保证找到最优分段。 最近提出了加速动态规划算法的想法,同时仍能保证找到成本函数的真实最小值。 在这里,我们扩展了这些剪枝方法,并引入了两种用于分割数据的新算法:FPOP 和 SNIP。 经验结果显示,FPOP 比现有的动态规划方法快得多,并且与现有方法不同,其计算效率不受数据中变化点数量的影响。 我们评估了该方法在检测拷贝数变异方面的性能,并观察到 FPOP 的计算成本与二分分割法具有竞争力。
摘要: There is an increasing need for algorithms that can accurately detect changepoints in long time-series, or equivalent, data. Many common approaches to detecting changepoints, for example based on penalised likelihood or minimum description length, can be formulated in terms of minimising a cost over segmentations. Dynamic programming methods exist to solve this minimisation problem exactly, but these tend to scale at least quadratically in the length of the time-series. Algorithms, such as Binary Segmentation, exist that have a computational cost that is close to linear in the length of the time-series, but these are not guaranteed to find the optimal segmentation. Recently pruning ideas have been suggested that can speed up the dynamic programming algorithms, whilst still being guaranteed to find true minimum of the cost function. Here we extend these pruning methods, and introduce two new algorithms for segmenting data, FPOP and SNIP. Empirical results show that FPOP is substantially faster than existing dynamic programming methods, and unlike the existing methods its computational efficiency is robust to the number of changepoints in the data. We evaluate the method at detecting Copy Number Variations and observe that FPOP has a computational cost that is competitive with that of Binary Segmentation.
评论: 20页
主题: 方法论 (stat.ME) ; 计算 (stat.CO)
MSC 类: 62M10
引用方式: arXiv:1409.1842 [stat.ME]
  (或者 arXiv:1409.1842v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.1409.1842
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Robert Maidstone [查看电子邮件]
[v1] 星期五, 2014 年 9 月 5 日 15:44:34 UTC (307 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
stat.ME
< 上一篇   |   下一篇 >
新的 | 最近的 | 2014-09
切换浏览方式为:
stat
stat.CO

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号