2ヶ月前

ラベル分離フレームワークによる显著物体検出

Jun Wei; Shuhui Wang; Zhe Wu; Chi Su; Qingming Huang; Qi Tian
ラベル分離フレームワークによる显著物体検出
要約

より正確な注目度マップを獲得するために、最近の手法は主に完全畳み込みネットワーク(FCN)からの多レベル特徴量の集約と、エッジ情報の補助的な監督としての導入に焦点を当てています。これらの手法により著しい進歩が達成されていますが、我々はピクセルがエッジに近づくほど予測が困難になることを観察しました。これは、エッジピクセルの分布が非常に不均衡であるためです。この問題に対処するため、我々はラベル分離フレームワーク(LDF)を提案します。LDFはラベル分離(LD)プロセスと特徴量相互作用ネットワーク(FIN)で構成されています。LDは元の注目度マップを明示的にボディマップと詳細マップに分解します。ここで、ボディマップはオブジェクトの中核領域に集中し、詳細マップはエッジ周辺の領域に焦点を当てます。詳細マップは伝統的なエッジ監督よりも多くのピクセルを含むため、より効果的に機能します。注目度マップとは異なり、ボディマップではエッジピクセルが排除され、中核領域のみに注意が向けられます。これにより訓練中にエッジピクセルによる混乱が回避されます。したがって、FINではボディマップと詳細マップそれぞれに対応する2つのブランチを使用しています。特徴量相互作用(FI)はこれら2つの相補的なブランチを融合して注目度マップを予測することを目指しており、その結果得られた注目度マップを使って再度2つのブランチを洗練します。このような反復的な洗練はより良い表現学習とより精密な注目度マップの生成に役立ちます。6つのベンチマークデータセットでの包括的な実験により、LDFが異なる評価指標において最先端のアプローチを超えることが示されました。