
要約
過去5年間、畳み込みニューラルネットワーク(CNNs)は自律走行などの多くの応用分野における核心的なタスクの一つであるセマンティックセグメンテーションで優れた成果を上げています。しかし、CNNsの訓練には大量のデータが必要であり、その収集は困難で、アノテーションも手間がかかるものです。最近のコンピュータグラフィックスの進歩により、写真のようにリアルな合成画像とコンピュータ生成のアノテーションを使用してCNNsを訓練することが可能になりました。しかしながら、実際の画像と合成データとの間のドメインミスマッチはモデルの性能を著しく低下させます。したがって、都市風景のセマンティックセグメンテーションにおけるドメインギャップを最小限に抑えるため、カリキュラム型学習手法を提案します。このカリキュラムドメイン適応手法では、まず簡単なタスクから始めて目標ドメインに関する必要な特性を推定します。特に最初のタスクは、画像全体でのグローバルラベル分布とランドマークスーパーピクセル上の局所分布を学習することです。これらの分布は推定しやすい理由として、都市風景の画像には建物や道路、車などのかなり強い特徴(サイズや空間関係など)があるからです。次に、目標ドメインでの予測がこれらの推定された特性に従うように正則化しながらセグメンテーションネットワークを訓練します。実験では、当手法が2つのデータセットおよび2つのバックボーンネットワークにおいてベースラインを超える性能を示しました。また、当手法に関する広範なアブレーションスタディも報告しています。