13日前

時系列行動定位の向上:再帰機構を備えた先進的なS6モデリング

Sangyoun Lee, Juho Jung, Changdae Oh, Sunghee Yun
時系列行動定位の向上:再帰機構を備えた先進的なS6モデリング
要約

時系列行動局所(Temporal Action Localization, TAL)は、動画解析における重要なタスクであり、行動の正確な開始時刻と終了時刻を特定することを目的としている。従来の手法としてCNN、RNN、GCN、Transformerなどが用いられているが、これらは長距離依存性や時系列因果関係を十分に捉えることができないという限界がある。こうした課題に対応するため、本研究では選択的状態空間モデル(Selective State Space Model, S6)を活用した新たなTALアーキテクチャを提案する。本手法は、特徴量集約型双方向S6ブロック(Feature Aggregated Bi-S6 block)、二重Bi-S6構造(Dual Bi-S6 structure)、および再帰機構を統合することで、パラメータ数の増加を伴わずに時系列的・チャネル方向の依存性を強化することを実現した。標準ベンチマークデータセットにおける広範な実験の結果、THUMOS-14でmAP 74.2%、ActivityNetで42.9%、FineActionで29.6%、HACSで45.8%という最先端の性能を達成した。消去実験(ablation study)により、Stemモジュールにおける二重構造および再帰機構が従来手法を上回ることを実証した。本研究の成果は、S6に基づくモデルがTALタスクにおいて大きな可能性を有していることを示しており、今後の研究に道を開くものである。

時系列行動定位の向上:再帰機構を備えた先進的なS6モデリング | 最新論文 | HyperAI超神経