基于半监督三维深度神经网络和自适应波段选择的高光谱图像分类
原文:《Hyperspectral imagery classification based on semi-supervised 3-D deep neural network and adaptive band selection》
1 主要问题
HSI分类仍然有以下问题:
- 光谱波段之间的高度相关性;
- 不同光谱特征的空间变异性;
- 产生Hughes现象的大量光谱波段,即当波段数量非常高时,分类性能降低,而训练样本的数量非常有限。
所以降维(DR)在HSI分类之前是必要的,因为它允许减少光谱波段的数量,以及分类所需的时间。DR的两个主要方法是特征提取和光谱波段选择。特征提取旨在将原始高光谱数据投影到具有原始光谱波段线性或非线性变换的缩减子空间中,其中缩减子空间的维度远小于原始 HSI 的维度。波段选择试图选择相关光谱波段的子集,即所选择的光谱带应该是最有鉴别力的,信息量最大的,而且相关性和冗余度都很低的。
2 解决方法
- 提出了一种自适应DR方法,通过寻找最具信息量、最具辨识度和最具特色的低冗余光谱波段,同时保留HSI的物理意义,解决维数问题。它是一种半监督波段选择方法,不需要大量的训练样本来选择光谱波段。
- 提出了一种基于卷积编码器-解码器的半监督三维CNN的HSI空间光谱分类方法,利用较少的训练样本提取HSI的空间光谱特征,提高了分类性能。
3 主要思路
自适应降维方法可以解决维度诅咒的问题,休斯。事实上,当每个类别的标记训练样本的数量与像素的维度相比非常小时,即HSI的光谱带(特征)的数量与用于训练的样本数量之间的比率非常低时,就会出现这个问题。事实上,休斯现象经常导致错误的分类,因此导致不良的表现。此外,当我们增加3-D CNN分类器的输入(HSI)中的规格带数量时,分类率会下降。通常情况下,维数的诅咒会限制三维CNN分类器的泛化能力,并引起过度拟合问题。因此,为了克服维数诅咒,避免半监督3-D CNN模型的过度拟合,我们提出了一种半监督频段选择方法,其目的是在保留HSI中原始数据的物理意义的同时,找到信息量最大、鉴别力最强和最具特色的频段。因此,我们不使用全部的光谱带来训练半监督的三维CNN模型,而只使用减少的相关带子集。
3.1 适应性降维(ADR)
所提出的自适应降维 (ADR) 的主要目标是通过找到最相关的光谱波段来降低
HSI
的高维。因此,我们提出了一种半监督方法,旨在寻找具有高鉴别、高信息和低冗余准则(DIR)的相关波段。
形式上,给定一个HSI表示为
其中
其中
第二步使用未标记的训练样本寻找信息光谱波段,减少冗余,如下所示:
因此,通过结合方程式。 (1)、(3)、(4) 和
(5),我们可以选择具有最高冗余的前
其中使用
3.2 用于HSI分类的半监督三维CNN
在本节中,我们提出了用于HSI空间光谱分类的半监督3-DCNN。HSI用三维立方体表示,它包含两个空间维度(每个光谱带的大小)和一个光谱维度(光谱带的数量)。每个像素连同它的相邻像素,即大小为
其中
因此,我们将卷积编码器-解码器与监督3DCNN进行扩展,以执行半监督3DCNN,该CNN通过保留空间特征来考虑标记和未标记样本。
形式上,让我们考虑
其中,
- 干净编码路径:通过干净的编码路径处理标记和未标记的训练样本,以计算隐藏变量
。因此,该函数可以表示如下: 
- 噪声编码路径:使用高斯噪声对标记和未标记的训练样本进行损坏。此外,通过使用噪声编码器将它们转换为抽象表示
。形式上,我们可以将此步骤定义为: 
- 解码器:它寻求重建预测的
,使它们尽可能接近 。这可以表示如下: 
因此,我们提出的半监督三维CNN旨在使用两种成本函数,即用于标记训练样本的softmax函数和用于未标记训练样本的卷积编码器-解码器。使用方程式(13)和
(14),我们可以得到这个公式:
使用这个半监督 3D
CNN,我们可以同时从 HSI 中学习所提出的网络模型和频谱空间特征。
图5显示了所提出的用于HSI空间光谱分类的半监督三维CNN的架构。在三维CNN的编码器网络中,我们有以下操作:三维卷积、批量归一化和池化。在三维CNN的解码器网络中,我们有以下操作:三维卷积、批量归一化和
unpooling(解池化?)。最后一层是soft-max函数。