7日前

SOLQ:クエリを学習することでオブジェクトをセグメンテーションする

Bin Dong, Fangao Zeng, Tiancai Wang, Xiangyu Zhang, Yichen Wei
SOLQ:クエリを学習することでオブジェクトをセグメンテーションする
要約

本稿では、インスタンスセグメンテーションのためのエンドツーエンドフレームワークを提案する。最近導入されたDETR [1] を基盤として、本手法はSOLQと呼ばれる。SOLQは、統一されたクエリを学習することにより、物体をセグメンテーションする。SOLQでは、各クエリが1つの物体を表し、クラス、位置、マスクという複数の表現形式を持つ。学習された物体クエリは、統一されたベクトル形式で同時に分類、ボックス回帰、マスク符号化を実行する。学習フェーズでは、符号化されたマスクベクトルは、元の空間マスクの圧縮符号化によって監視される。推論時においては、生成されたマスクベクトルが圧縮符号化の逆プロセスによって直接空間マスクに変換可能である。実験結果から、SOLQは既存の多くのアプローチを上回る最先端の性能を達成することが示された。さらに、統一クエリ表現の同時学習により、DETRの検出性能が大幅に向上することが明らかになった。本研究のSOLQが、Transformerベースのインスタンスセグメンテーションにおける強力なベースラインとして活用されることを期待する。コードは https://github.com/megvii-research/SOLQ にて公開されている。

SOLQ:クエリを学習することでオブジェクトをセグメンテーションする | 最新論文 | HyperAI超神経