7日前

DiffusionInst:インスタンスセグメンテーションのための拡散モデル

Zhangxuan Gu, Haoxing Chen, Zhuoer Xu, Jun Lan, Changhua Meng, Weiqiang Wang
DiffusionInst:インスタンスセグメンテーションのための拡散モデル
要約

拡散フレームワークは、従来の最先端画像生成モデルと同等の性能を達成している。特に、ノイズから画像への復元パイプラインの強力さから、研究者たちはその変種が識別タスクにおいてどのように機能するかに強い関心を寄せている。本論文では、インスタンスをインスタンス認識フィルタとして表現し、インスタンスセグメンテーションをノイズからフィルタへの復元プロセスとして定式化する新たなフレームワーク、DiffusionInstを提案する。このモデルは、RPNからのいかなる誘導的バイアスも持たず、ノイズが加えられた正解データを逆方向に学習する。推論時には、ランダムに生成されたフィルタを入力として受け取り、1ステップまたは複数ステップのノイズ除去によってマスクを出力する。COCOおよびLVISにおける広範な実験結果から、ResNetやSwin Transformerといったさまざまなバックボーンを用いた既存のインスタンスセグメンテーションモデルと比較して、DiffusionInstは競争力のある性能を達成していることが示された。本研究が、より効率的な拡散フレームワークの設計を促す強力なベースラインとして機能することを期待している。コードは以下のURLで公開されている:https://github.com/chenhaoxing/DiffusionInst。

DiffusionInst:インスタンスセグメンテーションのための拡散モデル | 最新論文 | HyperAI超神経