Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2508.07468

帮助 | 高级搜索

计算机科学 > 人工智能

arXiv:2508.07468 (cs)
[提交于 2025年8月10日 ]

标题: CP代理:代理约束编程

标题: CP-Agent: Agentic Constraint Programming

Authors:Stefan Szeider
摘要: 将自然语言问题描述翻译成形式化约束模型仍然是约束编程中的一个基本挑战,这需要对问题领域和建模框架都有深入的专业知识。 以往自动完成此翻译的方法采用了固定的工作流程和预定的建模步骤,在大量基准问题上都出现了失败。 我们提出了一种新的方法,采用纯粹的代理策略,没有任何固定的流水线。 我们开发了一个基于ReAct(思考与行动)原则的通用Python编码代理,利用持久化的IPython内核进行有状态的代码执行和迭代开发。 而不是将约束编程逻辑嵌入到代理架构中,领域专业知识仅通过精心设计的项目提示注入。 该代理将这种提示编码的知识与对文件操作和代码执行工具的访问相结合,使其能够动态地测试假设、调试失败并验证解决方案。 该架构仅用几百行代码实现,成功解决了CP-Bench约束编程基准集中的所有101个问题。 结果表明,约束建模任务需要结合通用的编码工具和通过提示编码的领域专业知识,而不是专门的代理架构或预定义的工作流程。
摘要: Translating natural language problem descriptions into formal constraint models remains a fundamental challenge in constraint programming, requiring deep expertise in both the problem domain and modeling frameworks. Previous approaches to automating this translation have employed fixed workflows with predetermined modeling steps, failing on a significant number of benchmark problems. We present a new approach using a pure agentic strategy without any fixed pipeline. We developed a general-purpose Python coding agent based on the ReAct (Reason and Act) principle, utilizing a persistent IPython kernel for stateful code execution and iterative development. Rather than embedding constraint programming logic into the agent architecture, domain-specific expertise is injected solely through a carefully crafted project prompt. The agent combines this prompt-encoded knowledge with access to file operations and code execution tools, enabling it to test hypotheses, debug failures, and verify solutions dynamically. Implemented in just a few hundred lines of code, this architecture successfully solves all 101 problems of the CP-Bench constraint programming benchmark set. The results suggest that constraint modeling tasks require the combination of general coding tools and domain expertise encoded in prompts, rather than specialized agent architectures or predefined workflows.
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL); 机器学习 (cs.LG); 软件工程 (cs.SE)
引用方式: arXiv:2508.07468 [cs.AI]
  (或者 arXiv:2508.07468v1 [cs.AI] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.07468
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Stefan Szeider [查看电子邮件]
[v1] 星期日, 2025 年 8 月 10 日 19:59:01 UTC (17 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.AI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs
cs.CL
cs.LG
cs.SE

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号