统计学 > 机器学习
[提交于 2024年2月13日
]
标题: 通过非配对点批次的熵传输核算子
标题: Transfer Operators from Batches of Unpaired Points via Entropic Transport Kernels
摘要: 本文关注于估计随机变量$X$和$Y$的联合概率,已知$N$个独立的观测块 $(\boldsymbol{x}^i,\boldsymbol{y}^i)$,$i=1,\ldots,N$,每个块包含$M$个样本 $(\boldsymbol{x}^i,\boldsymbol{y}^i) = \bigl((x^i_j, y^i_{\sigma^i(j)}) \bigr)_{j=1}^M$,其中$\sigma^i$表示 i.i.d. 的未知排列。 采样的对组$(x^i_j,y_j^i)$, $j=1,\ldots,M$。 这意味着在一个观测块内$M$个样本的内部顺序未知。 我们推导出一个最大似然推理泛函,提出了一种计算上易于处理的近似方法,并分析了它们的性质。 特别是,我们证明了一个$\Gamma$-收敛结果,表明当块的数量$N$趋向于无穷大时,我们可以从经验近似中恢复真实的密度。 利用熵最优传输核,我们构建了一类关于数据密度函数假设空间的模型,该推理泛函可以在这些假设空间上被最小化。 这个假设类特别适合于从数据中近似推导转移算子。 通过修改EMML算法以考虑额外的转移概率约束来解决由此产生的离散最小化问题,并证明了该算法的收敛性。 概念验证示例展示了我们方法的潜力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.