Command Palette
Search for a command to run...
LSTA: エゴセントリック行動認識のための長短期注意機構
LSTA: エゴセントリック行動認識のための長短期注意機構
Swathikiran Sudhakaran Sergio Escalera Oswald Lanz
概要
エゴセントリック活動認識は、ビデオ分析における最も困難な課題の一つです。このタスクでは、小さな物体とその操作を細かく区別する必要があります。一部の手法は強力な監督学習や注意メカニズムに依存していますが、これらの手法はアノテーションに多大な労力を要するか、または時空間パターンを考慮していないという問題があります。本論文では、LSTA(Long Short-Term Attention)を提案し、空間的に関連のある部分からの特徴に焦点を当てつつ、ビデオシーケンス内で注意が滑らかに追跡されるように設計しています。私たちはエンドツーエンドで学習可能な二ストリームアーキテクチャを使用して、エゴセントリック活動認識におけるLSTAの有効性を示し、4つの標準ベンチマークで最先端の性能を達成しました。