6 个月前

摘要

由于标注数据的稀缺性，使用在ImageNet上预训练的监督模型已成为遥感场景分类领域的事实标准。然而，近年来高分辨率遥感（HRRS）图像数据集的规模不断扩大，自监督学习技术也取得了显著进展，这引发了两个关键问题：在遥感场景分类任务中，是否仍有必要依赖ImageNet上的监督预训练？相较于在ImageNet上进行监督预训练，使用HRRS图像数据集进行监督预训练，或在ImageNet上进行自监督预训练，哪种方式能在目标遥感场景分类任务上取得更优性能？为回答上述问题，本文在多个HRRS图像数据集上，系统地进行了从零开始训练模型、微调在ImageNet上预训练的监督模型以及微调自监督学习模型的实验。同时，我们评估了所学表征在HRRS场景分类任务中的迁移能力，结果表明：自监督预训练的性能优于监督预训练，而HRRS数据集上的监督预训练表现与自监督预训练相当，或略低。最终，本文提出一种“领域自适应预训练”策略，即先使用ImageNet预训练模型，再在领域内HRRS图像上进行第二轮预训练。实验结果表明，该方法所得到的模型在HRRS场景分类基准测试中达到了当前最优水平。相关源代码及预训练模型已公开，可访问：\url{https://github.com/risojevicv/RSSC-transfer}。

源 PDF