基于半监督卷积生成对抗网络的高光谱图像分类
原文:《Semi-supervised convolutional generative adversarial network for hyperspectral image classification》
主要问题
- 获取标记样本既耗时又昂贵,基于深度学习的分类模型包含大量的系数,需要足够的样本进行训练,因此基于深度学习的分类方法将面临过拟合问题。严重的过拟合问题会导致训练过程中训练精度较高,但在测试阶段表现较差的现象。
- 现有的基于GAN的HSI分类方法没有利用3D深度残差网络(ResNet)的优良分类能力,这些模型也没有综合利用生成样本、标记样本和未标记样本的互补特征进行半监督分类。
解决方法
- 半监督学习通过生成模型、低密度分离、基于图和基于包装器的方法,同时利用标记样本和未标记样本来提高模型泛化能力。本文提出的方法同时使用生成数据、标记样本和未标记样本来训练鉴别器,有效地提高了模型的泛化能力和分类性能
- 在GAN框架中,3D全卷积网络和3D深层ResNet可以结合起来,分别利用它们在图像生成和分类方面的能力,将生成的样本、标记的样本和未标记的样本整合在一起,可以提高识别器的分类精度。
GAN
标准GAN是一种新颖的生成模型,它包含一个生成模型
其中
本文方法
模型描述
由于深度卷积网络在图像处理领域的出色处理能力和半监督学习在有限标记样本下的优势,我们将DCGAN架构和半监督GAN策略结合起来。在我们提出的方法中,我们使用一个具有分数步长卷积的深度卷积网络作为生成器,并将判别器
在传统的监督分类中,这种模型可以利用模型预测分布
在提出的半监督DCGAN架构中,我们向鉴别器提供三个输入:生成的、未标记的和标记的数据。假设我们有相同数量的这三种类型的样本,因此每种类型的样本在训练中具有同等的重要性。相应地,我们将像素级鉴别器损失函数
标记样本的损失与标准分类网络相同,我们考虑平均交叉熵
对于无标记样本,损失为
最后,对生成的样本进行假预测,作为
其中
其中,
由于FM只匹配一阶统计量,FM生成器可能最终得到一个平凡的解,并崩溃为未标记特征的平均值,这将无法覆盖流形之间的某些区域。为了处理这个问题,我们可以通过最小化生成器的修改损失来增加生成分布的熵。
HSI分类的结构
在用于HSI分类的SS-DCGAN模型中,考虑到计算效率和分类精度,我们首先通过主成分分析(PCA)将HSI波段的数目减少到5个分量,这样不仅保留了空间和光谱信息,而且在用于HSI分类的SS-DCGAN模型中,考虑到计算效率和分类精度,我们首先将计算复杂度降低到合适的规模,以稳定GAN的训练过程。生成器将输入噪声转换为与具有五个主成分的HSI数据相同大小的伪样本,鉴别器接受三种类型的样本作为输入,并给出输入样本的类别标签。
我们方法的生成器是一个3D全卷积网络,它用步长卷积代替了池化函数。生成器的第一层只是一个线性矩阵乘法,它可以将均匀的噪声分布
鉴别器是一个 3D 深度 ResNet,它具有两个残差块和三个卷积层,如图 4 所示。与生成器一样,我们对除输入和输出层之外的所有层应用批量归一化来促进训练。LeakyReLU激活是 ReLU 激活的改进,它可以比鉴别器中的 ReLU 效果更好,因此我们对除鉴别器中最后一个卷积层之外的所有层使用LeakyReLU激活。此外,在卷积层的末端使用一个softmax分类器来给出输入样本的标签。
结论
我们提出了一种新颖的SS-DCGAN模型用于高光谱图像(HSI)的半监督分类,该模型依赖于两个方面。第一,生成器和判别器均使用3D深度学习模型来处理立方体HSI,以保持内部的光谱-空间特征。第二,半监督策略可以有效利用有限的标记样本、大量的未标记样本和生成样本,在标记样本有限的情况下提高分类性能。因此,通过在半监督学习框架中使用生成和未标记样本,大多数深度学习方法引起的过拟合问题可以得到缓解。在分类实验中,使用PCA提取光谱-空间特征并稳定训练过程,高光谱图像被归一化到0到1之间。SS-DCGAN的性能在三种广泛使用的高光谱图像数据集上进行了测试,并与最先进的传统和基于深度学习的分类方法进行了对比,结果证实了所提方法的有效性。值得注意的是,卷积GAN在图像处理领域具有广阔的前景,将基于图的GAN引入HSI半监督分类也是一个可能的未来研究方向。