
摘要
监督学习技术在遥感领域的诸多任务中占据核心地位。然而,这些方法,尤其是近年来兴起的深度学习方法,通常需要大量标注数据进行训练。尽管卫星能够获取海量数据,但数据标注过程往往繁琐、成本高昂,且需要专业知识。因此,亟需发展对标注样本依赖更少的改进方法。本文提出MSMatch,这是首个在EuroSAT和UC Merced Land Use基准数据集上场景分类任务中性能可与监督学习方法相媲美的半监督学习方法。我们在EuroSAT数据集上同时测试了RGB与多光谱图像,并开展了多项消融实验,以识别模型中的关键组件。所训练的神经网络在EuroSAT数据集上取得了当前最优的分类性能,其准确率相较于先前方法最高提升达19.76%,具体提升幅度取决于标注训练样本的数量。仅需每类5个标注样本,MSMatch在EuroSAT的RGB和多光谱数据集上分别实现了94.53%和95.86%的准确率。在UC Merced Land Use数据集上,我们的方法相比已有工作最高提升5.59%,在同样仅使用每类5个标注样本的情况下达到了90.71%的准确率。实验结果表明,MSMatch能够显著降低对标注数据的需求,且在多光谱数据上具有良好的泛化能力,有望推动当前因缺乏标注数据而难以实现的多种遥感应用。我们已将MSMatch的源代码公开上线,以支持结果的可复现性及快速推广应用。