数学 > 优化与控制
[提交于 2025年10月25日
]
标题: 无导数顺序二次规划用于等式约束随机优化
标题: Derivative-Free Sequential Quadratic Programming for Equality-Constrained Stochastic Optimization
摘要: 我们考虑解决具有随机目标函数和确定性等式约束的非线性优化问题,假设对于目标函数和约束条件仅能获得零阶信息,并且目标函数还受到随机采样噪声的影响。 在这一设定下,我们提出了一种无导数随机顺序二次规划(DF-SSQP)方法。 由于缺乏导数信息,我们采用同时扰动随机逼近(SPSA)技术来随机估计目标函数和约束条件的梯度和海森矩阵。 这种方法在每次迭代步骤中只需要一个与维度无关的零阶评估数量——最少为八个。 我们无导数方法与现有基于导数的SSQP方法之间的一个关键区别在于,由随机零阶近似引入的复杂随机偏差,该偏差出现在目标函数和约束条件的梯度和海森矩阵估计中。 为了解决这个问题,我们引入了一种基于动量风格估计器的在线去偏技术,该技术适当聚合过去的梯度和海森矩阵估计以减少随机噪声,同时通过移动平均方案避免过高的内存成本。 在标准假设下,我们建立了所提出的DF-SSQP方法的全局几乎必然收敛性。 值得注意的是,我们进一步通过证明重新缩放的迭代点表现出渐近正态性,其极限协方差矩阵类似于基于导数的方法实现的最小最大最优协方差矩阵,尽管由于缺乏导数信息而更大,从而补充了全局分析。 我们的局部分析使得可以利用DF-SSQP进行模型参数的在线统计推断。 在基准非线性问题上的数值实验展示了DF-SSQP的全局和局部行为。
当前浏览上下文:
math.OC
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.