2ヶ月前

背景を考慮したクロスレベル融合による擬態物体検出

Chen, Geng ; Liu, Si-Jie ; Sun, Yu-Jia ; Ji, Ge-Peng ; Wu, Ya-Feng ; Zhou, Tao
背景を考慮したクロスレベル融合による擬態物体検出
要約

カモフラージュされた物体検出(COD)は、自然なシーンに自己を隠している物体を識別することを目指しています。正確なCODは、境界のコントラストが低く、物体の外観に大きな変動があること(例えば、物体のサイズや形状)などの課題に直面しています。これらの課題に対処するため、我々は新しいコンテキスト認識型クロスレベル融合ネットワーク(C2F-Net)を提案します。このネットワークは、カモフラージュされた物体を正確に識別するためにコンテキスト認識型クロスレベル特徴量を融合します。具体的には、我々の注意誘導型クロスレベル融合モジュール(ACFM)を使用して、多層特徴量から情報量豊富な注意係数を計算し、その注意係数のガイダンスのもとで特徴量を統合します。さらに、豊富なグローバルコンテキスト情報を活用して情報量豊富な特徴表現を得るために、双方向グローバルコンテキストモジュール(DGCM)を提案します。複数のACFMとDGCMが連続的に統合され、高層特徴量から粗い予測を生成します。この粗い予測は注意マップとして機能し、低層特徴量がカモフラージュ推論モジュール(CIM)に渡される前にそれらを精製します。我々は3つの広く使用されているベンチマークデータセットで広範な実験を行い、C2F-Netと最先端(SOTA)モデルとの比較を行いました。結果は、C2F-Netが効果的なCODモデルであり、SOTAモデルに対して著しく優れていることを示しています。さらに、ポリープセグメンテーションデータセットでの評価では、C2F-NetがCODの下流応用において有望な可能性を持つことが示されました。当方のコードは公開されており、以下のURLからアクセスできます: https://github.com/Ben57882/C2FNet-TSCVT.

背景を考慮したクロスレベル融合による擬態物体検出 | 最新論文 | HyperAI超神経