2ヶ月前
Faster R-CNNアーキテクチャの再考:時間的アクション局所化のために
Yu-Wei Chao; Sudheendra Vijayanarasimhan; Bryan Seybold; David A. Ross; Jia Deng; Rahul Sukthankar

要約
我々はTAL-Netを提案します。これは、Faster R-CNNオブジェクト検出フレームワークに着想を得た、動画内の時間的アクション局所化の改良アプローチです。TAL-Netは既存手法の3つの主要な欠点に対処しています:(1) 極端なアクション持続時間の変動に対応できる多スケールアーキテクチャを使用して、受容野のアライメントを改善します;(2) 提案生成とアクション分類のために、適切に受容野を拡張することで時間的コンテキストをより効果的に活用します;(3) 明示的にマルチストリーム特徴量融合を考え、モーションの遅延融合が重要であることを示しています。THUMOS'14検出ベンチマークにおいて、アクション提案と局所化の両方で最先端の性能を達成しており、ActivityNetチャレンジでも競争力のある性能を発揮しています。