11日前

TriDet:相対境界モデリングを用いた時系列行動検出

Dingfeng Shi, Yujie Zhong, Qiong Cao, Lin Ma, Jia Li, Dacheng Tao
TriDet:相対境界モデリングを用いた時系列行動検出
要約

本稿では、時間的アクション検出を対象としたワンステージ型フレームワーク「TriDet」を提案する。従来の手法は、動画におけるアクション境界の曖昧さにより、境界予測が不正確になるという課題に直面している。この問題を緩和するために、境界周辺における推定された相対確率分布を用いてアクション境界をモデル化する新しい「Trident-head」を提案する。TriDetの特徴ピラミッドにおいて、動画特徴量における自己注意機構(self-attention)が生じるランク損失(rank loss)を軽減し、異なる時間的粒度間の情報を統合するための効率的な「スケーラブル・グレインラティリティ・ペルセプション(Scalable-Granularity Perception: SGP)層」を導入する。Trident-headとSGPに基づく特徴ピラミッドの利点を活かすことで、TriDetはTHUMOS14、HACS、EPIC-KITCHENS 100の3つの困難なベンチマークにおいて、従来手法と比較してより高い性能を達成しつつ、計算コストを低減している。例えば、THUMOS14において、TriDetは平均mAPで69.3%を達成し、以前の最良手法を2.5%上回る性能を発揮しつつ、処理遅延はその74.6%にまで抑えることができる。本研究のコードは、https://github.com/sssste/TriDet にて公開されている。

TriDet:相対境界モデリングを用いた時系列行動検出 | 最新論文 | HyperAI超神経