Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > math > arXiv:2412.02972

帮助 | 高级搜索

数学 > 优化与控制

arXiv:2412.02972 (math)
[提交于 2024年12月4日 ]

标题: 基于在线自适应Koopman算子的非线性动力学模型预测控制

标题: Model Predictive Control of Nonlinear Dynamics Using Online Adaptive Koopman Operators

Authors:Daisuke Uchida, Karthik Duraisamy
摘要: 本文开发了一种基于Koopman算子的自适应数据驱动模型预测控制(MPC)方法。虽然MPC在各种工程领域中广泛应用,但如果控制模型与真实动力学之间的建模误差持续存在,控制器性能可能会下降,这在复杂非线性动力学中可能经常发生。自适应MPC技术在线学习模型,使控制器能够通过结合新可用数据来补偿建模误差。我们利用Koopman算子框架来制定一种自适应MPC技术,通过凸优化以计算效率高的方式校正模型差异。通过使用神经网络学习嵌入空间,Koopman算子模型能够实现准确的动力学建模。然而,这种复杂的模型形式通常会导致在线学习不稳定。为此,所提出的方法利用了目标网络的软更新技术,该技术用于强化学习(RL)中模型学习的稳定化。此外,我们还讨论了根据线性嵌入模型的具体描述应选择哪些参数作为在线更新参数。在典型非线性动力系统上的数值仿真表明,所提出的方法在与其他数据驱动MPC方法相比表现更优,同时通过利用Koopman算子实现了更高的计算效率。
摘要: This paper develops a methodology for adaptive data-driven Model Predictive Control (MPC) using Koopman operators. While MPC is ubiquitous in various fields of engineering, the controller performance can deteriorate if the modeling error between the control model and the true dynamics persists, which may often be the case with complex nonlinear dynamics. Adaptive MPC techniques learn models online such that the controller can compensate for the modeling error by incorporating newly available data. We utilize the Koopman operator framework to formulate an adaptive MPC technique that corrects for model discrepancies in a computationally efficient manner by virtue of convex optimization. With the use of neural networks to learn embedding spaces, Koopman operator models enable accurate dynamics modeling. Such complex model forms, however, often lead to unstable online learning. To this end, the proposed method utilizes the soft update of target networks, a technique used in stabilization of model learning in Reinforcement Learning (RL). Also, we provide a discussion on which parameters to be chosen as online updated parameters based on a specific description of linear embedding models. Numerical simulations on a canonical nonlinear dynamical system show that the proposed method performs favorably compared to other data-driven MPC methods while achieving superior computational efficiency through the utilization of Koopman operators.
主题: 优化与控制 (math.OC)
引用方式: arXiv:2412.02972 [math.OC]
  (或者 arXiv:2412.02972v1 [math.OC] 对于此版本)
  https://doi.org/10.48550/arXiv.2412.02972
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Daisuke Uchida [查看电子邮件]
[v1] 星期三, 2024 年 12 月 4 日 02:34:03 UTC (662 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
math.OC
< 上一篇   |   下一篇 >
新的 | 最近的 | 2024-12
切换浏览方式为:
math

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号