计算机科学 > 机器学习
[提交于 2025年10月31日
]
标题: 具有 Herald 引导提示的双大型语言模型架构用于并行细粒度交通信号控制
标题: A Dual Large Language Models Architecture with Herald Guided Prompts for Parallel Fine Grained Traffic Signal Control
摘要: 利用大型语言模型(LLMs)在交通信号控制(TSC)中相比传统的强化学习(RL)方法提高了优化效率和可解释性。 然而,现有的基于LLM的方法受限于固定时间的信号持续时间,并容易出现幻觉错误,而RL方法在信号定时决策中缺乏鲁棒性,并且泛化能力差。 为了解决这些挑战,本文提出了HeraldLight,一种由Herald引导提示增强的双LLM架构。 Herald模块根据实时条件提取上下文信息并预测每个交通阶段的队列长度。 第一个LLM,LLM-Agent,使用这些预测来进行细粒度的交通信号控制,而第二个LLM,LLM-Critic,对LLM-Agent的输出进行细化,纠正错误和幻觉。 这些细化的输出用于基于评分的微调,以提高准确性和鲁棒性。 使用CityFlow在涵盖济南(12个)、杭州(16个)和纽约(196个)共224个交叉口的真实世界数据集上进行的仿真实验表明,HeraldLight优于最先进的基线方法,在所有场景中平均行驶时间减少了20.03%,在济南和杭州场景中平均队列长度减少了10.74%。 源代码可在GitHub上获得:https://github.com/BUPT-ANTlab/HeraldLight.
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.