凝聚态物理 > 统计力学
[提交于 2025年10月3日
]
标题: 基于能量模型的最小耗散学习
标题: Minimal-Dissipation Learning for Energy-Based Models
摘要: 我们证明了持久链能量基础模型(EBM)的近似最大似然估计(MLE)目标函数的偏差恰好等于过阻尼朗之万动力系统中的热力学过量功。 然后我们回答了这样的模型是否可以在有限时间内以最小的过量功,即能量耗散进行训练。 我们发现,具有常数方差的高斯能量函数可以通过仅控制学习率来以最小的过量功进行训练。 这证明了在有限时间内以最小耗散训练持久链EBM是可能的,并且还提供了计算所需的能量下限。 我们将这种最小化过量功的学习过程称为最小耗散学习。 然后我们给出了最优学习率调度到一般势能的推广,并发现它在MLE目标函数上诱导了一个自然梯度流,这是一种众所周知的二阶优化方法。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.