计算机科学 > 计算机视觉与模式识别
[提交于 2025年8月1日
]
标题: SU-ESRGAN:用于卫星和无人机影像超分辨率的语义和不确定性感知ESRGAN,适用于跨领域评估的微调
标题: SU-ESRGAN: Semantic and Uncertainty-Aware ESRGAN for Super-Resolution of Satellite and Drone Imagery with Fine-Tuning for Cross Domain Evaluation
摘要: 生成对抗网络(GANs)已经实现了图像的现实超分辨率(SR),然而,它们在语义一致性以及每个像素的置信度方面存在不足,这限制了它们在关键遥感应用中的可信度,如灾害响应、城市规划和农业。 本文介绍了语义和不确定性感知的ESRGAN(SU-ESRGAN),这是第一个为卫星图像设计的SR框架,结合了ESRGAN、通过DeepLabv3进行分割损失以保留类别细节以及蒙特卡洛丢弃以生成像素级不确定性图。 SU-ESRGAN在航空图像上的结果(PSNR、SSIM、LPIPS)与基准ESRGAN相当。 这种新模型在使用广角(FoV)相机的卫星系统或无人机(UAVs)中具有价值,以空间分辨率为代价换取覆盖范围。 模块化设计允许在无人机数据管道中集成,用于机载或后期处理SR,以增强由于运动模糊、压缩和传感器限制导致的图像。 此外,该模型进行了微调,以评估其在跨域应用中的性能。 测试是在两个基于无人机的数据集上进行的,这两个数据集在高度和成像视角上有所不同。 微调模型的性能评估显示,对航空海事无人机数据集有更强的适应性,其成像特征与训练数据一致,突显了在SR应用中领域感知训练的重要性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.