
要約
既存の注目物体検出(SOD)に関する研究では、エッジ情報を利用した特徴的な物体の抽出と、複数レベルの特徴を統合することによりSODの性能向上に焦点を当てています。満足できる性能を達成するためには、洗練されたエッジ情報と低レベルの多段階不一致が用いられています。しかし、性能向上と計算効率の両方を同時に得ることは困難であり、これにより我々は既存のエンコーダー-デコーダー構造における非効率性を研究し、このトレードオフを回避することを目指しています。我々はTRACERを提案します。この手法は、注意制御追跡モジュールを取り入れることで明確なエッジを持つ注目物体を検出します。最初のエンコーダー終了時に高速フーリエ変換を使用して洗練されたエッジ情報を下流の特徴抽出に伝播させるために、マスク付きエッジ注意モジュールを用いています。複数レベル統合フェーズでは、ユニオン注意モジュールが補完的なチャネルと重要な空間情報を識別します。デコーダーの性能向上と計算効率改善のために、オブジェクト注意モジュールを使用してデコーダーブロックの利用を最小限に抑えます。このモジュールは、洗練されたチャネルと空間表現から未検出の物体とエッジ情報を抽出します。さらに、全てのピクセルを均等に扱う従来の損失関数とは異なり、比較的重要度が高いピクセルに対処するため適応的な画素強度損失関数を提案します。13種類の既存手法との比較において、TRACERは5つのベンチマークデータセットで最先端の性能を達成しています。TRACERはhttps://github.com/Karel911/TRACERにて公開されています。