2ヶ月前

普遍的な半教師付き意味分割

Tarun Kalluri; Girish Varma; Manmohan Chandraker; C V Jawahar
普遍的な半教師付き意味分割
要約

近年、意味分割の必要性がさまざまなアプリケーションや環境で高まっています。しかし、アノテーションのコストと冗長性は、どのドメインでも訓練に利用できるラベルの量を制限する要因となっています。一方で、単一のモデルが複数のドメインで効果的に動作すれば、展開が容易になります。本論文では、普遍的な半教師あり意味分割という新しい問題を提起し、その二重のニーズ(低いアノテーションコストと展開コスト)に対応する解決フレームワークを提案します。微調整や共同学習、無教師ドメイン適応などの対比手法とは異なり、普遍的な半教師ありセグメンテーションは以下の点を保証します:(i) 全てのドメインで単一のモデルが展開される、(ii) ラベルなしデータが使用される、(iii) 性能が向上する、(iv) ごく少量のラベルのみが必要となる、(v) ラベル空間が異なる場合でも対応可能である。これを達成するために、監視下での損失だけでなく同一ドメイン内およびクロスドメイン間での無教師損失も最小化します。後者に対しては、ピクセル認識エントロピー正則化に基づく新たな特徴量整列目的関数を導入しています。我々はドイツ、イングランド、インドなど異なる地理的領域や屋外・屋内などの環境におけるセグメンテーションデータセットの組み合わせにおいて他の手法よりも定量的な優位性を示すとともに、整列された表現に関する定性的な洞察も提供しています。