电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月11日
]
标题: Mamba-FCS:联合时空频特征融合、变化引导注意机制和SeK损失的遥感增强语义变化检测
标题: Mamba-FCS: Joint Spatio- Frequency Feature Fusion, Change-Guided Attention, and SeK Loss for Enhanced Semantic Change Detection in Remote Sensing
摘要: 语义变化检测(SCD)从遥感图像需要平衡广泛的空域上下文、计算效率和对类别不平衡土地覆盖变化的敏感性。 虽然卷积神经网络在局部特征提取方面表现出色,但缺乏全局上下文,而Transformer在高计算成本下提供全局建模。 基于状态空间模型的最近Mamba架构通过线性复杂度和高效的长距离建模提供了有吸引力的解决方案。 在本研究中,我们引入了Mamba-FCS,一个基于视觉状态空间模型主干的SCD框架,包括一个联合空频融合块,结合对数幅度频域特征以增强边缘清晰度并抑制光照伪影,一个变化引导注意(CGA)模块,明确连接自然交织的BCD和SCD任务,以及一个为类别不平衡性能优化量身定制的分离Kappa(SeK)损失。 在SECOND和Landsat-SCD数据集上的广泛评估表明,Mamba-FCS达到了最先进的指标,SECOND数据集上88.62%的整体准确率,65.78%的F_scd,25.50%的SeK,Landsat-SCD数据集上96.25%的整体准确率,89.27%的F_scd,60.26%的SeK。 消融分析确认了每个新组件的独特贡献,定性评估突显了SCD的显著改进。 我们的结果强调了Mamba架构的显著潜力,通过所提出的技术增强,在遥感应用中设定了有效的和可扩展的语义变化检测的新基准。 完整的源代码、配置文件和预训练模型将在发表后公开。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.