电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月12日
(v1)
,最后修订 2025年9月18日 (此版本, v2)]
标题: 一个新的数据集和多相机帧合成的比较
标题: A new dataset and comparison for multi-camera frame synthesis
摘要: 存在许多用于图像序列中帧合成的方法,但可以大致分为帧插值和视角合成技术。 从根本上说,帧插值和视角合成都解决相同的任务,即在时间或空间上给定周围帧的情况下进行帧插值。 然而,大多数帧插值数据集侧重于时间方面,使用单个摄像头在时间和空间中移动,而视角合成数据集通常偏向于立体深度估计的应用场景。 这使得直接比较视角合成和帧插值方法变得具有挑战性。 在本文中,我们开发了一个新颖的多摄像机数据集,使用自定义构建的密集线性摄像机阵列,以实现这些方法之间的公平比较。 我们将经典方法和深度学习帧插值器与一种视角合成方法(3D高斯点云)在视角中间处理任务中进行评估。 我们的结果表明,在真实图像数据上,深度学习方法并未显著优于经典方法,3D高斯点云的实际表现甚至比帧插值器低多达3.5 dB PSNR。 然而,在合成场景中,情况则相反——在95%置信度下,3D高斯点云比帧插值算法高出近5 dB PSNR。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.