Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess > arXiv:2508.20135

帮助 | 高级搜索

电气工程与系统科学 > 图像与视频处理

arXiv:2508.20135 (eess)
[提交于 2025年8月26日 ]

标题: 面向未改善道路的数据高效点云语义分割流程

标题: Data-Efficient Point Cloud Semantic Segmentation Pipeline for Unimproved Roads

Authors:Andrew Yarovoi, Christopher R. Valenta
摘要: 在本案例研究中,我们提出了一种数据高效的点云分割流程和训练框架,用于对未改善的道路和其他七个类别进行鲁棒分割。 我们的方法采用了一个两阶段的训练框架:首先,在公共城市数据集的混合数据和一个小的、精心挑选的领域内数据集上对基于投影的卷积神经网络进行预训练;然后,在领域内数据上仅对轻量级预测头进行微调。 在此过程中,我们探索了点提示训练在批量归一化层中的应用,以及流形混叠作为我们流程中的正则化效果。 我们还探讨了引入直方图归一化的环境以进一步提升性能的效果。 仅使用来自目标领域的50个标记点云,我们表明,与在领域内数据上进行简单训练相比,我们提出的训练方法将平均交并比从33.5%提高到51.8%,整体准确率从85.5%提高到90.8%。 至关重要的是,我们的结果表明,在多个数据集上进行预训练是提高泛化能力的关键,并且在有限的领域内监督下实现了鲁棒的分割。 总体而言,本研究展示了一个在具有挑战性、低数据场景下的鲁棒三维语义分割的实用框架。 我们的代码可在以下位置获得:https://github.com/andrewyarovoi/MD-FRNet.
摘要: In this case study, we present a data-efficient point cloud segmentation pipeline and training framework for robust segmentation of unimproved roads and seven other classes. Our method employs a two-stage training framework: first, a projection-based convolutional neural network is pre-trained on a mixture of public urban datasets and a small, curated in-domain dataset; then, a lightweight prediction head is fine-tuned exclusively on in-domain data. Along the way, we explore the application of Point Prompt Training to batch normalization layers and the effects of Manifold Mixup as a regularizer within our pipeline. We also explore the effects of incorporating histogram-normalized ambients to further boost performance. Using only 50 labeled point clouds from our target domain, we show that our proposed training approach improves mean Intersection-over-Union from 33.5% to 51.8% and the overall accuracy from 85.5% to 90.8%, when compared to naive training on the in-domain data. Crucially, our results demonstrate that pre-training across multiple datasets is key to improving generalization and enabling robust segmentation under limited in-domain supervision. Overall, this study demonstrates a practical framework for robust 3D semantic segmentation in challenging, low-data scenarios. Our code is available at: https://github.com/andrewyarovoi/MD-FRNet.
评论: 9页,4图
主题: 图像与视频处理 (eess.IV) ; 人工智能 (cs.AI)
引用方式: arXiv:2508.20135 [eess.IV]
  (或者 arXiv:2508.20135v1 [eess.IV] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.20135
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Andrew Yarovoi [查看电子邮件]
[v1] 星期二, 2025 年 8 月 26 日 20:00:36 UTC (724 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
eess.IV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs
cs.AI
eess

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号