
要約
当社の研究は、コンピュータビジョンにおける基本的な課題である画像セグメンテーションに取り組んでおり、これは多様な応用分野において重要な役割を果たしています。教師あり手法はその効率性を示していますが、広範なピクセルレベルのアノテーションへの依存がスケーラビリティを制限しています。そこで、本稿ではDynaSeg(ダイナセグ)と呼ばれる革新的な教師なし画像セグメンテーション手法を提案します。DynaSegは、特徴類似度と空間的連続性のバランスを取るという課題を克服し、広範なハイパーパラメータ調整に依存することなく機能します。伝統的な手法とは異なり、DynaSegは動的な重み付けスキームを採用しており、パラメータ調整を自動化し、画像特性に柔軟に対応し、他のセグメンテーションネットワークとの容易な統合を可能にします。シルエットスコアフェーズを取り入れることで、予測されたクラスタ数が1に収束するなどの過小セグメンテーションの失敗を防ぎます。DynaSegはCNNベースおよび事前学習済みのResNetを使用して特徴抽出を行い、計算効率が高く、他の複雑なモデルよりも単純化されています。実験結果では、COCO-AllおよびCOCO-Stuffデータセットにおいて現在の教師なしセグメンテーション手法に対してそれぞれ12.2%および14.12%のmIOU向上が達成され、最先端の性能を示しています。5つのベンチマークデータセットでの定性的および定量的評価結果を通じて、提案手法の有効性を示しています。コードは以下のURLから入手可能です: https://github.com/RyersonMultimediaLab/DynaSeg