2ヶ月前

学習カリキュラムのドメイン適応アプローチを用いた都市シーンの意味分割

Yang Zhang; Philip David; Hassan Foroosh; Boqing Gong
学習カリキュラムのドメイン適応アプローチを用いた都市シーンの意味分割
要約

過去5年間、畳み込みニューラルネットワーク(CNNs)は自律走行や拡張現実などの多くのアプリケーションにおける主要なタスクの一つである意味分割において優れた成果を上げています。しかし、CNNsを訓練するには大量のデータが必要であり、その収集は困難で、アノテーションも労力を要します。最近のコンピュータグラフィックスの進歩により、写真のような合成画像とコンピュータ生成のアノテーションを使用してCNNsを訓練することが可能になりました。しかしながら、実際の画像と合成データ間のドメインミスマッチがモデルの性能を阻害しています。そこで、都市シーンの意味分割におけるドメインギャップを最小限に抑えるため、カリキュラム型学習アプローチを提案します。カリキュラムドメイン適応はまず簡単なタスクから解決し、目標ドメインに関する必要な特性を推定します。特に最初のタスクは、画像全体でのグローバルラベル分布とランドマークスーパーピクセル上の局所分布を学習することです。これらの分布は都市シーンの画像に強い特徴があるため(例えば建物、道路、車などの大きさや空間的な関係)、比較的容易に推定できます。次に、セグメンテーションネットワークを訓練しつつ、目標ドメインでの予測がこれらの推定された特性に従うように正則化します。実験では、当社の手法は2つのデータセットと2つのバックボーンネットワークにおいてベースラインを超える性能を示しました。また、当社アプローチに関する広範なアブレーションスタディも報告しています。

学習カリキュラムのドメイン適応アプローチを用いた都市シーンの意味分割 | 最新論文 | HyperAI超神経