电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月26日
]
标题: RDDM:面向真实世界图像修复的RAW域扩散模型实践
标题: RDDM: Practicing RAW Domain Diffusion Model for Real-world Image Restoration
摘要: 我们提出了RAW域扩散模型(RDDM),这是一种端到端的扩散模型,可以直接从传感器RAW数据中恢复照片级真实感图像。 尽管最近的sRGB域扩散方法取得了令人印象深刻的结果,但它们在高保真度和真实生成之间陷入了一个两难境地。 由于这些模型处理的是有损的sRGB输入,并且在许多场景中忽略了传感器RAW图像的可访问性,例如在边缘设备中的图像和视频捕捉,导致性能次优。 RDDM通过直接在RAW域中恢复图像来绕过这一限制,替换了传统的两阶段图像信号处理(ISP)+ IR流程。 然而,将预训练的扩散模型简单地适应到RAW域会遇到分布外(OOD)问题。 为此,我们提出:(1)一个RAW域变分自编码器(RVAE),学习最优潜在表示,(2)一个可微的后期色调处理(PTP)模块,实现RAW和sRGB空间的联合优化。 为了弥补数据集的不足,我们开发了一个可扩展的退化流程,从现有的sRGB数据集中合成RAW低质量-高质量(LQ-HQ)对以进行大规模训练。 此外,我们设计了一个可配置的多拜耳(CMB)LoRA模块,用于处理各种RAW模式,如RGGB、BGGR等。 大量实验表明,RDDM在最先进的sRGB扩散方法上表现出优势,产生了更高保真度的结果,且伪影更少。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.