基于双分支双注意机制网络的高光谱图像分类
原文:《Classification of Hyperspectral Image Based on Double-Branch Dual-Attention Mechanism Network》
摘要
近年来,研究人员越来越关注使用深度学习方法进行高光谱图像 (HSI) 分类。 为了提高准确性并减少训练样本,我们在本文中提出了一种用于 HSI 分类的双分支双注意力机制网络 (DBDA)。 DBDA 中设计了两个分支来捕获 HSI 中包含的大量光谱和空间特征。 此外,通道注意力块和空间注意力块分别应用于这两个分支,这使得 DBDA 能够细化和优化提取的特征图。 在四个高光谱数据集上进行的一系列实验表明,所提出的框架具有优于最先进算法的性能,尤其是在训练样本明显缺乏的情况下。
主要贡献
在本文中,受最先进的 DBMA 算法和自适应自注意机制双重注意网络(DANet)[44] 的启发,我们设计了用于 HSI 分类的双分支双重注意机制网络(DBDA) 。所提出的框架包含两个分支,分别称为光谱分支和空间分支,分别捕获光谱和空间特征。 采用通道注意机制和空间注意机制来细化特征图。 通过连接两个分支的输出,我们获得了融合的光谱空间特征。 最后,使用 softmax 函数确定分类结果。 本文的三个重要贡献可列举如下:
- 基于 DenseNet 和 3D-CNN,我们提出了一个端到端框架双分支双注意力机制网络 (DBDA)。 所提出框架的光谱分支和空间分支可以分别利用特征而无需任何特征工程。
- 在光谱和空间维度上引入了一种灵活且自适应的自注意力机制。通道注意块主要关注信息丰富的光谱波段,空间注意块主要关注信息丰富的像素点。
- DBDA 在训练数据有限的四个数据集中获得了最先进的分类精度。 此外,我们提出的网络的时间消耗少于两个比较的深度学习算法。
注意力机制
3D-CNN 的一个缺点是所有空间像素和光谱带在空间和光谱域中具有等效的权重。 显然,不同的光谱波段和空间像素对提取特征的贡献不同。 注意力机制是处理这个问题的强大技术。 受人类视觉感知过程 [46] 的启发,注意力机制旨在更多地关注信息区域,而较少考虑非必要区域。 注意机制已被用于图像分类[47],后来被证明在其他领域表现出色,包括图像描述[48]、文本到图像合成[49]和场景分割[44]等。在DANet[44]中 ,可以采用通道注意块和空间注意块来增加引人注目的通道和像素的权重。 下面将对这两个块进行详细介绍。
光谱注意块
如图 4a 所示,通道注意力图
其中
其中
在ImageNet-1K数据集中,通过插入我们的小模块,我们从不同的基线网络获得了精度的提高,显示了CBAM的有效性。我们使用GRAD-CAM可视化训练的模型,并观察到CBAM增强网络比其基线网络更恰当地聚焦于目标对象。考虑到这一点,我们推测性能的提升来自于对无关杂波的准确关注和降噪。最后,我们在MS
Coco和VOC
2007数据集上验证了目标检测的性能改进,展示了CBAM的广泛适用性。由于我们精心设计了轻量级的模块,因此在大多数情况下,参数和计算的开销可以忽略不计。
本文贡献:我们的主要贡献有三方面。
贡献可以概括为: