统计学 > 方法论
[提交于 2025年10月28日
]
标题: 具有未知特征数的多变量计数数据的贝叶斯非参数建模
标题: Bayesian nonparametric modeling of multivariate count data with an unknown number of traits
摘要: 特征和特质分配模型是贝叶斯非参数学中的基本对象,在多个应用中起着重要作用。然而,现有的方法通常假设数据的完全可交换性,这在具有异质但相关组的设置中可能具有限制性。在本文中,我们引入了一类通用且易于处理的贝叶斯非参数先验,用于部分可交换的特质分配模型,依赖于完全随机向量。我们提供了全面的理论分析,包括边缘和后验分布的显式表达式,并在二元和泊松分布特质的情况下展示了我们框架的易处理性。我们方法的一个显著特点是特质的数量是一个随机量,从而允许我们对未观察到的特质进行建模和估计。基于这些结果,我们还开发了一个新颖的混合模型,从数据中推断群体划分结构,有效地对特质分配进行聚类。这种扩展推广了贝叶斯非参数潜在类别模型,并避免了当特质数量被假定为固定时出现的系统性过度聚类。我们通过一个应用到Operazione Infinito调查中的Ndrangheta犯罪网络,展示了我们方法的实用性,其中我们的模型提供了对非法活动组织的见解。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.