
要約
完全畳み込みモデルは、様々な視覚タスクにおいて高密度予測に成功しています。これらのモデルは監督学習の設定下で良好な性能を示しますが、人間の観察者にとっては軽微に見えるドメインシフトの下では、驚くほど低い性能を示すことがあります。例えば、ある都市で訓練を行い、地理的に異なる地域や異なる天候条件の別の都市でテストを行うと、ピクセルレベルでの分布シフトにより、性能が大幅に低下することがあります。本論文では、初めてのドメイン適応的なセマンティックセグメンテーション手法を提案し、ピクセル予測問題に対する非監督的な敵対的手法を導入します。当手法は、全体的な適応技術とカテゴリ固有の適応技術の両方から構成されています。全体的なドメインアライメントは、新しい全畳み込みドメイン敵対学習を用いたセマンティックセグメンテーションネットワークによって行われます。この初期的に適応された空間は、制約付き弱学習の一般化を通じてカテゴリ固有の適応を可能にし、ソースドメインからターゲットドメインへの空間レイアウトの明示的な転送を実現します。我々の手法は、複数の大規模データセット上で異なる設定においてベースラインを超える性能を示しており、実際の都市環境間での適応や異なる合成サブドメイン間での適応、シミュレーション環境から実際の環境への適応、そして新しい大規模ダッシュカムデータセット上でも優れた結果を出しています。注:「全畳み込み」(fully convolutional)、「制約付き弱学習」(constrained weak learning)などの専門用語は一般的な日本語訳を使用しました。「ダッシュカム」(dash-cam)も一般的な日本語表現として使用しました。