
摘要
本文提出了一种改进的U-Net架构训练协议,用于航空影像的语义分割。我们在具有挑战性的FLAIR #2数据集上验证了所提出方法的有效性。通过开展详尽的消融实验,系统分析了不同组件对整体性能的影响,涵盖不同模型主干网络(backbone)、图像增强策略、学习率调度器、损失函数以及训练流程的对比研究。此外,我们提出了一种两阶段训练策略,并评估了多种模型集成(ensemble)方案的性能表现。基于实验结果,我们最终确定了最优的模型训练配置。该最终方案将相对误差降低了约18%,并实现了0.641的mIoU(平均交并比),创下该任务新的最先进(state-of-the-art)性能纪录。相关代码已开源,地址为:https://github.com/strakaj/U-Net-for-remote-sensing。