2ヶ月前

高解像度二値画像セグメンテーションの双方向参照

Zheng, Peng ; Gao, Dehong ; Fan, Deng-Ping ; Liu, Li ; Laaksonen, Jorma ; Ouyang, Wanli ; Sebe, Nicu
高解像度二値画像セグメンテーションの双方向参照
要約

高解像度二値画像セグメンテーション(DIS)のための新しい双方向参照フレームワーク(BiRefNet)を紹介します。このフレームワークは、2つの主要な構成要素から成り立っています:位置特定モジュール(LM)と、我々が提案する双方向参照(BiRef)を使用した再構築モジュール(RM)。LMは、全体的な意味情報を用いて物体の位置を特定するのに役立ちます。RM内では、階層的な画像パッチがソース参照となり、勾配マップがターゲット参照となるBiRefを用いて再構築プロセスを行います。これらの構成要素が協調して動作し、最終的な予測マップを生成します。また、細かい詳細に焦点を当てるために補助的な勾配監督を導入しています。さらに、DISに特化した実践的な学習戦略について説明し、マップの品質と学習プロセスの改善を目指しています。我々のアプローチの一般的な適用可能性を検証するために、4つのタスクで広範な実験を行い、その結果BiRefNetが優れた性能を示し、すべてのベンチマークにおいてタスク固有の最先端手法を超えることを証明しました。コードは https://github.com/ZhengPeng7/BiRefNet で公開されています。

高解像度二値画像セグメンテーションの双方向参照 | 最新論文 | HyperAI超神経