11日前

再帰的アテンションリジッドモジュールを備えた双方向特徴ピラミッドネットワークによる影検出

{Xiao-Wei Hu, Pheng-Ann Heng, Chi-Wing Fu, Zijun Deng, Lei Zhu, Xuemiao Xu, Jing Qin}
再帰的アテンションリジッドモジュールを備えた双方向特徴ピラミッドネットワークによる影検出
要約

本稿では、深層畳み込みニューラルネットワーク(CNN)の深層におけるグローバルな文脈と浅層におけるローカルな文脈を探索・統合することで、影の検出を行うネットワークを提案する。本ネットワーク設計には2つの技術的貢献がある。第一に、隣接する2つのCNN層の文脈を統合し、残差を選択するための注目マップ(attention map)を学習するための再帰的注目残差(Recurrent Attention Residual: RAR)モジュールを定式化した。第二に、ネットワーク内に二系列のRARモジュールを配置し、深層から浅層および浅層から深層の両方向に文脈特徴を逐次的に統合・精緻化することで、異なるCNN層にまたがる影の文脈を効果的に集約する双方向特徴ピラミッドネットワーク(Bidirectional Feature Pyramid Network: BFPN)を構築した。これにより、誤検出をより効果的に抑制しつつ、影の細部情報を強化することが可能となる。本手法は、一般的な影検出ベンチマークデータセットであるSBUおよびUCFで評価された。実験結果から、本ネットワークは既存の最良手法に対して、SBUではバランス誤差率(balance error rate)を34.88%、UCFでは34.57%低減することを確認した。

再帰的アテンションリジッドモジュールを備えた双方向特徴ピラミッドネットワークによる影検出 | 最新論文 | HyperAI超神経