
摘要
本文从深度神经网络应用于遥感数据语义分割的角度,探讨了三个不同方面的问题。首先,我们聚焦于从遥感数据中进行建筑物语义分割,并提出了一种名为ICT-Net的新型网络结构。该网络在INRIA和AIRS两个基准数据集上进行了测试,结果表明,其在Jaccard指数上的表现分别优于其他所有先进方法超过1.5%和1.8%。其次,鉴于建筑物分类通常是三维重建流程中的第一步,我们进一步研究了分类精度与重建精度之间的关联性。最后,本文提出了一个简洁而具有说服力的新概念——隐式学习(latent learning),并探讨了其在深度学习背景下的重要意义。我们提出,一个针对主任务(如建筑物分类)进行训练的神经网络,会无意中学习到与主任务互补的辅助任务(例如道路、树木等的分类)的相关特征。我们在包含多标签真实标注的ISPRS基准数据集上对这一方法进行了广泛验证,结果表明:在道路分类上的平均F1分数为54.29%(标准差SD=17.03),汽车为10.15%(SD=2.54),树木为24.11%(SD=5.25),低矮植被为42.74%(SD=6.62),杂乱物体为18.30%(SD=16.08)。本文的源代码及补充材料已公开发布于:http://www.theICTlab.org/lp/2019ICT-Net/。