Command Palette
Search for a command to run...
マスクガイダンスを用いた反復学習の復活によるインタラクティブセグメンテーション
マスクガイダンスを用いた反復学習の復活によるインタラクティブセグメンテーション
Konstantin Sofiiuk Ilia A. Petrov Anton Konushin
概要
クリックベースのインタラクティブセグメンテーションに関する最近の研究では、推論時最適化スキームを用いることで、最先端の性能が達成されている。これらの手法は、推論中にネットワークを逆方向に伝搬(バックワードパス)する必要があるため、フォワードパスのみをサポートするモバイルフレームワークでは展開が困難であり、前向きなアプローチと比べて著しく計算コストが高くなる。本論文では、インタラクティブセグメンテーションの様々な設計選択肢を体系的に評価した結果、追加の最適化スキームを一切用いずに、新たな最先端性能が達成可能であることを発見した。そこで、前段階のセグメンテーションマスクを活用するシンプルなフォワードパスモデルを提案する。このモデルは、まったく新しいオブジェクトをセグメントするだけでなく、外部から提供されたマスクを初期状態として受け入れ、その修正も可能である。異なるデータセットで訓練されたモデルの性能を分析した結果、訓練データセットの選定がインタラクティブセグメンテーションの品質に大きく影響することが明らかになった。特に、COCOとLVISの組み合わせ、かつ多様で高品質なアノテーションを有するデータセットで訓練されたモデルは、既存のすべてのモデルを上回る性能を示した。コードおよび学習済みモデルは、https://github.com/saic-vul/ritm_interactive_segmentation にて公開されている。