7日前
プログレッシブ学習を用いた再帰的汎用輪郭ベースのインスタンスセグメンテーション
Hao Feng, Keyi Zhou, Wengang Zhou, Yufei Yin, Jiajun Deng, Qi Sun, Houqiang Li

要約
輪郭ベースのインスタンスセグメンテーションは、複雑な背景における視覚的オブジェクト処理において柔軟性と洗練されたアプローチを備えるため、近年活発に研究が進められている。本研究では、汎用的な輪郭ベースのインスタンスセグメンテーションを実現するための新たな深層ネットワークアーキテクチャ、すなわちPolySnakeを提案する。古典的なSnakeアルゴリズムに着想を得た本手法は、反復的かつ段階的な輪郭の精緻化戦略を採用することで、優れた性能と高いロバスト性を達成する。技術的にPolySnakeは、輪郭を反復的に推定するための再帰的更新演算子を導入している。このアーキテクチャは、単一の輪郭推定値を維持しつつ、それをオブジェクトの境界に段階的に変形させていく。各反復ステップにおいて、PolySnakeは現在の輪郭に対して意味情報を豊富に含む表現を構築し、それを再帰的演算子に供給して輪郭の更なる調整を実行する。この反復的な精緻化により、輪郭は徐々に安定した状態に収束し、オブジェクトインスタンスをきっちりと包み込む形となる。一般的なインスタンスセグメンテーションの枠組みを超えて、本手法の有効性および汎用性を検証するため、シーンテキスト検出およびレーン検出という2つの具体的なタスクシナリオにおいても広範な実験を実施した。実験結果から、提案手法PolySnakeは、3つのタスクにわたる複数の代表的なベンチマークにおいて、既存の最先端手法を上回る性能を示した。コードおよび事前学習済みモデルは、https://github.com/fh2019ustc/PolySnake にて公開されている。