数学 > 优化与控制
[提交于 2024年7月8日
]
标题: 不稳定潜在流形上的策略优化系统稳定化
标题: System stabilization with policy optimization on unstable latent manifolds
摘要: 稳定性是在研究动力系统行为时的基本要求。 然而,通过强化学习来稳定动力系统具有挑战性,因为在不稳定性被触发且数据变得无意义之前,只能在短时间内收集到少量数据。 本文介绍了一种强化学习方法,该方法在不稳定动力系统的潜在流形上进行公式化,从而可以从少量数据样本中训练出稳定策略。 不稳定的流形是极小的,因为它们包含学习能够保证稳定的策略所必需的最低维动力学。 这与旨在近似所有——稳定和不稳定——系统动力学的一般潜在流形形成鲜明对比,因此这些流形维度更高,通常需要更多的数据。 实验表明,所提出的方法即使在仅有少量数据样本的情况下也能稳定复杂的物理系统,而其他在系统状态空间或一般潜在流形上操作的方法则会失败。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.