16日前
ReAct:関係性クエリを用いた時系列行動検出
Dingfeng Shi, Yujie Zhong, Qiong Cao, Jing Zhang, Lin Ma, Jia Li, Dacheng Tao

要約
本研究は、物体検出で顕著な成果を上げたDETRと同様に、エンコーダ-デコーダフレームワークとアクションクエリを用いた時系列行動検出(Temporal Action Detection: TAD)の性能向上を目指す。しかし、このフレームワークをTADに直接適用した場合、いくつかの問題が生じる。具体的には、デコーダにおけるクエリ間の関係性の不十分な探索、訓練サンプル数が限られていることによる分類学習の不十分さ、および推論時の分類スコアの信頼性の欠如である。これらの課題に対処するため、本研究ではまず、クエリ間の関係に基づいて注意機構を導向する「関係性注意機構(relational attention mechanism)」をデコーダに導入する。さらに、アクション分類の学習を促進・安定化するための2つの損失関数を提案する。最後に、推論段階で各アクションクエリの局所化品質を予測することで、高品質なクエリを識別する手法を提案する。本研究で提唱する手法は「ReAct」と命名され、THUMOS14データセットにおいて最先端の性能を達成するとともに、従来手法と比較してはるかに低い計算コストを実現した。さらに、各提案コンポーネントの有効性を検証するため、広範なアブレーションスタディを実施した。実装コードは、https://github.com/sssste/React にて公開されている。