Average-Cost MDPs with Infinite State and Action Sets: New Sufficient Conditions for Optimality Inequalities and Equations

Feinberg, Eugene A.; Kasyanov, Pavlo O.; Paliichuk, Liliia S.

数学 > 优化与控制

arXiv:2412.01594v2 (math)

[提交于 2024年12月2日 (v1) ，最后修订 2025年1月27日 (此版本， v2)]

标题：具有无限状态和动作集的平均成本MDPs：最优不等式和方程的新充分条件

标题： Average-Cost MDPs with Infinite State and Action Sets: New Sufficient Conditions for Optimality Inequalities and Equations

Authors:Eugene A. Feinberg, Pavlo O. Kasyanov, Liliia S. Paliichuk

摘要：本文研究具有Borel状态和动作集的离散时间平均成本无限时限马尔可夫决策过程（MDPs）。它为MDPs的最优不等式和最优方程的{那里的}有效性引入了新的充分条件，这些MDPs具有弱连续和集合连续的转移概率。这些不等式和方程意味着确定性最优策略的存在。

摘要： This paper studies discrete-time average-cost infinite-horizon Markov decision processes (MDPs) with Borel state and action sets. It introduces new sufficient conditions for { the} validity of optimality inequalities and optimality equations for MDPs with weakly and setwise continuous transition probabilities. These inequalities and equations imply the existence of deterministic optimal policies.

主题：	优化与控制 (math.OC)
MSC 类：	90C39, 90C40
引用方式：	arXiv:2412.01594 [math.OC]
	(或者 arXiv:2412.01594v2 [math.OC] 对于此版本)
	https://doi.org/10.48550/arXiv.2412.01594

提交历史

来自： Eugene Feinberg [查看电子邮件]
[v1] 星期一， 2024 年 12 月 2 日 15:10:15 UTC (17 KB)
[v2] 星期一， 2025 年 1 月 27 日 01:22:25 UTC (18 KB)

全文链接：

获取论文：

查看许可

当前浏览上下文:

math.OC

新的 | 最近的 | 2024-12

切换浏览方式为:

math

参考文献与引用

导出 BibTeX 引用

数学 > 优化与控制

标题：具有无限状态和动作集的平均成本MDPs：最优不等式和方程的新充分条件

标题： Average-Cost MDPs with Infinite State and Action Sets: New Sufficient Conditions for Optimality Inequalities and Equations

提交历史

获取论文：

参考文献与引用

收藏

文献和引用工具

与本文相关的代码，数据和媒体

演示

推荐器和搜索工具

arXivLabs：与社区合作伙伴的实验项目

数学 > 优化与控制

标题： 具有无限状态和动作集的平均成本MDPs：最优不等式和方程的新充分条件 显示英文标题

标题： Average-Cost MDPs with Infinite State and Action Sets: New Sufficient Conditions for Optimality Inequalities and Equations

提交历史

获取论文：

参考文献与引用

BibTeX 格式的引用

收藏

文献和引用工具

与本文相关的代码，数据和媒体

演示

推荐器和搜索工具

arXivLabs：与社区合作伙伴的实验项目

标题：具有无限状态和动作集的平均成本MDPs：最优不等式和方程的新充分条件