
要約
私たちはMOVEという新しい手法を紹介します。この手法は、監督なしで物体をセグメンテーションするためのものです。MOVEは、前景の物体が初期位置に対して局所的にシフトされると、現実的な(歪みのない)新しい画像が生成されることを利用しています。この特性により、アノテーションのない画像データセット上でセグメンテーションモデルを訓練し、無監督显著物体検出とセグメンテーションのいくつかの評価データセットで最先端(SotA)の性能を達成することが可能となります。無監督単一物体発見において、MOVEはSotAに対して平均CorLocで7.2%の改善を示し、無監督クラス非依存物体検出では平均して相対APで53%の改善をもたらします。私たちのアプローチは、自己教師あり特徴量(例:DINOやMAEから得られるもの)、インペイントネットワーク(Masked AutoEncoderに基づくもの)および敵対的訓練に基づいて構築されています。