Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > physics > arXiv:1301.0148

帮助 | 高级搜索

物理学 > 数据分析、统计与概率

arXiv:1301.0148 (physics)
[提交于 2013年1月1日 ]

标题: 基于条件互信息的马尔可夫链阶数估计

标题: Markov Chain Order estimation with Conditional Mutual Information

Authors:Maria Papapetrou, Dimitris Kugiumtzis
摘要: 我们引入条件互信息(CMI)来估计马尔可夫链的阶数。对于一个由$K$个符号组成的马尔可夫链,我们定义阶数为$m$和$I_c(m)$的 CMI 是链中两个变量相隔$m$步时的互信息,并且以链中的中间变量为条件。我们基于 CMI 的估计偏差找到近似的解析显著性界限,并开发了一种基于$I_c(m)$随机化显著性检验的方法,其中随机化符号序列通过对原始符号序列的成分随机排列形成。显著性检验应用于递增的$m$值,马尔可夫链的阶数通过最后一个拒绝零假设的阶数来估计。 我们展示了蒙特卡洛模拟中 CMI 检验的适用性,并将其与赤池信息量准则(AIC)、贝叶斯信息量准则(BIC)、最大波动法(Peres-Shields 估计器)以及使用$\phi$-散度的递增阶数似然比检验进行了比较。CMI 检验的阶数标准对于大于一的阶数表现更优,但其对大阶数的有效性取决于数据的可用性。根据模拟结果,我们解释了 CMI 检验与其他准则估计的 DNA 链基因和基因间区域的阶数。
摘要: We introduce the Conditional Mutual Information (CMI) for the estimation of the Markov chain order. For a Markov chain of $K$ symbols, we define CMI of order $m$, $I_c(m)$, as the mutual information of two variables in the chain being $m$ time steps apart, conditioning on the intermediate variables of the chain. We find approximate analytic significance limits based on the estimation bias of CMI and develop a randomization significance test of $I_c(m)$, where the randomized symbol sequences are formed by random permutation of the components of the original symbol sequence. The significance test is applied for increasing $m$ and the Markov chain order is estimated by the last order for which the null hypothesis is rejected. We present the appropriateness of CMI-testing on Monte Carlo simulations and compare it to the Akaike and Bayesian information criteria, the maximal fluctuation method (Peres-Shields estimator) and a likelihood ratio test for increasing orders using $\phi$-divergence. The order criterion of CMI-testing turns out to be superior for orders larger than one, but its effectiveness for large orders depends on data availability. In view of the results from the simulations, we interpret the estimated orders by the CMI-testing and the other criteria on genes and intergenic regions of DNA chains.
评论: 16页,3个图;M. Papapetrou, D. Kugiumtzis, 马尔可夫链阶的条件互信息估计,《Physica A: Statistical Mechanics and its Applications》,2012年12月26日在线发布,ISSN 0378-4371
主题: 数据分析、统计与概率 (physics.data-an) ; 信息论 (cs.IT); 方法论 (stat.ME)
引用方式: arXiv:1301.0148 [physics.data-an]
  (或者 arXiv:1301.0148v1 [physics.data-an] 对于此版本)
  https://doi.org/10.48550/arXiv.1301.0148
通过 DataCite 发表的 arXiv DOI
相关 DOI: https://doi.org/10.1016/j.physa.2012.12.017
链接到相关资源的 DOI

提交历史

来自: Dimitris Kugiumtzis [查看电子邮件]
[v1] 星期二, 2013 年 1 月 1 日 23:54:15 UTC (76 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
physics.data-an
< 上一篇   |   下一篇 >
新的 | 最近的 | 2013-01
切换浏览方式为:
cs
cs.IT
math
math.IT
physics
stat
stat.ME

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号