广州大学主页
搜索
科学研究

Pixel Representation Augmented through Cross-Attention for High-Resolution Remote Sensing Imagery Segmentation

来源: 作者: 编辑:宋洁 发布日期:2024/09/24

在本研究中,我们提出了一种基于目标嵌入查询的多分辨率遥感影像土地覆盖分类方法。我们的主要目标是增强语义分割网络,以识别复杂背景和难以分类的类别中的特征类型。为了实现这一目标,我们使用了以下设置:

(1)我们在网络中设置了一组对象特征嵌入查询,并增强每个像素的特征表示。

(2)我们重新设计了转换器中的交叉注意模块,用于编码和解码不同类别的图像表示。

(3)训练多层次特征的对象嵌入查询,输出辅助损失,提高空间特征的学习。我们的实验表明,上述方法有效地从多尺度像素表示中提取类别对象表示,从而有助于识别相似的类别和背景。

此外,我们还设计了基于FPN的SFP,并采用压缩像素解码模块,以最大限度地减少模型的参数数量和推理时间,同时确保不损失性能。

原文链接:https://doi.org/10.3390/rs14215415