计算机科学 > 计算机视觉与模式识别
[提交于 2025年8月1日
]
标题: CoST:从统一时空视角出发的高效协作感知
标题: CoST: Efficient Collaborative Perception From Unified Spatiotemporal Perspective
摘要: 协作感知在不同代理之间共享信息,有助于解决个体代理可能面临的问题,例如遮挡和较小的感知范围。 先前的方法通常将多代理融合和多时间融合分为两个连续的步骤。 相反,本文提出了一种高效的协作感知,同时将来自不同代理(空间)和不同时间的观测结果聚合到一个统一的时空空间中。 统一的时空空间带来了两个好处,即高效的特征传输和优越的特征融合。 1)高效的特征传输:每个静态物体在时空空间中产生一个观测结果,因此只需要传输一次(而先前的方法多次重新传输所有物体特征)。 2)优越的特征融合:将多代理和多时间融合合并到一个统一的空间时间聚合中,能够提供更全面的视角,从而提升在挑战性场景中的感知性能。 因此,我们的基于时空变换器的协作感知(CoST)在效率和准确性方面都得到了提升。 值得注意的是,CoST不依赖于任何特定方法,并且与大多数先前方法兼容,在提高准确性的同时减少了传输带宽。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.