2ヶ月前

汎用的な少ショットセマンティックセグメンテーションのための強力なベースライン

Hajimiri, Sina ; Boudiaf, Malik ; Ayed, Ismail Ben ; Dolz, Jose
汎用的な少ショットセマンティックセグメンテーションのための強力なベースライン
要約

本論文では、単純な訓練プロセスと最適化が容易な推論フェーズを持つ汎用的なFew-Shotセグメンテーションフレームワークを紹介します。特に、よく知られているInfoMax原理に基づく単純かつ効果的なモデルを提案します。このモデルでは、学習された特徴表現とそれに対応する予測の間の相互情報量(Mutual Information: MI)が最大化されます。さらに、我々のMIベースの式から導かれた項は、知識蒸留(Knowledge Distillation)項と組み合わせられ、基本クラスに関する知識を保持します。単純な訓練プロセスにより、我々の推論モデルは基本クラスで訓練された任意のセグメンテーションネットワークに適用することができます。提案された推論手法は、人気のあるFew-ShotセグメンテーションベンチマークであるPASCAL-$5^i$およびCOCO-$20^i$において大幅な改善をもたらします。特に新規クラスについては、1-shotシナリオでは7%から26%、5-shotシナリオでは3%から12%の改善が見られます(それぞれPASCAL-$5^i$とCOCO-$20^i$)。また、性能差がより顕著になるより困難な設定も提案しています。我々のコードは公開されており、https://github.com/sinahmr/DIaM からアクセスできます。

汎用的な少ショットセマンティックセグメンテーションのための強力なベースライン | 最新論文 | HyperAI超神経