HyperAIHyperAI

Command Palette

Search for a command to run...

ISDA:変形アテンションを用いた位置認識型インスタンスセグメンテーション

Kaining Ying Zhenhua Wang Cong Bai Pengfei Zhou

概要

多くのインスタンスセグメンテーションモデルは、事前処理として提案領域推定(RPN)を組み込むか、後処理として非最大値抑制(NMS)を用いるため、エンドツーエンドでの学習が困難である。本研究では、新しいエンドツーエンド型インスタンスセグメンテーション手法であるISDAを提案する。本手法は、物体のマスク集合を予測する形にタスクを再定式化しており、学習可能な位置意識型カーネルと物体特徴量を用いた従来の畳み込み演算によってマスクを生成する。これらのカーネルおよび特徴量は、多スケール表現を活用した可変アテンションネットワークにより学習される。導入されたセット予測メカニズムにより、本手法はNMSを必要としない。実験的に、ISDAはMS-COCOデータセットにおいて強力なベースラインであるMask R-CNNを2.6ポイント上回り、最近のモデルと比較しても最先端の性能を達成している。コードは近日中に公開予定である。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
ISDA:変形アテンションを用いた位置認識型インスタンスセグメンテーション | 記事 | HyperAI超神経