计算机科学 > 计算机视觉与模式识别
[提交于 2026年1月8日
]
标题: UniLiPs:基于几何基础的动态场景分解的统一激光雷达伪标签方法
标题: UniLiPs: Unified LiDAR Pseudo-Labeling with Geometry-Grounded Dynamic Scene Decomposition
摘要: 无标签的LiDAR日志,在自动驾驶应用中,本质上是隐藏在显而易见之处的密集3D几何信息的金矿 - 但如果没有人工标签,它们几乎毫无用处,这突显了自动驾驶感知研究中的主要成本障碍。 在这项工作中,我们通过利用LiDAR扫描之间的时序几何一致性,将文本和2D视觉基础模型的提示直接提升并融合到3D中,而无需任何手动输入。 我们引入了一种无监督的多模态伪标签方法,该方法依赖于从时间累积的LiDAR地图中学习到的强几何先验,同时引入了一种新颖的迭代更新规则,以强制执行联合几何-语义一致性,并反之通过不一致性检测移动物体。 我们的方法同时生成3D语义标签、3D边界框和密集的LiDAR扫描,展示了在三个数据集上的强大泛化能力。 我们通过实验验证了我们的方法在现有语义分割和目标检测伪标签方法中表现优异,这些方法通常需要额外的人工监督。 我们确认,我们几何一致的、密度增加的LiDAR即使只占很小一部分,也能分别在80-150米和150-250米范围内将深度预测提高51.5%和22.0%的MAE。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.