计算机科学 > 计算机视觉与模式识别
[提交于 2026年1月7日
(v1)
,最后修订 2026年1月8日 (此版本, v2)]
标题: 通过领域自适应实现无标签数据的真实镜头主动对准
标题: Towards Real-world Lens Active Alignment with Unlabeled Data via Domain Adaptation
摘要: 主动对准(AA)是高精度光学系统大规模自动化装配的关键技术。 与耗时的逐模型设备校准相比,基于光学模拟构建的数字孪生流程在生成大规模标记数据方面具有显著优势。 然而,复杂的成像条件会在仿真和真实图像之间产生领域差距,限制了仿真训练模型的泛化能力。 为了解决这个问题,我们提出通过添加少量在随机错位位置捕获的未标记真实世界图像来增强仿真基线,从领域自适应的角度减轻差距。 我们引入了领域自适应主动对准(DA3),它利用自回归领域转换生成器和基于对抗的特征对齐策略,通过自监督学习提取真实领域信息。 这使得能够提取领域不变的图像退化特征,以促进稳健的错位预测。 在两种透镜类型的实验表明,DA3比纯粹的仿真流程提高了46%的准确性。 显著的是,它接近于在3个透镜样本上收集的精确标记的真实世界数据所实现的性能,同时将设备端数据收集时间减少了98.7%。 结果表明,领域自适应有效地赋予仿真训练模型强大的真实世界性能,验证了数字孪生流程作为显著提高大规模光学装配效率的实际解决方案。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.