HyperAIHyperAI

Command Palette

Search for a command to run...

軌道プールドディープコンボリューショナル記述子を用いた行動認識

Wang Limin Qiao Yu Tang Xiaoou

概要

動画における人間の行動理解において、視覚的特徴は極めて重要な役割を果たす。本論文では、手作業で設計された特徴量と深層学習によって得られる特徴量の両方の長所を兼ね備えた、新たな動画表現手法である「軌跡制約プーリング深層畳み込み記述子(Trajectory-Pooled Deep-Convolutional Descriptor, TDD)」を提案する。具体的には、判別性の高い畳み込み特徴マップを深層アーキテクチャを用いて学習し、それらの畳み込み特徴を効果的な記述子に統合するため、軌跡制約プーリングを適用する。TDDのロバスト性を向上させるために、畳み込み特徴マップを変換するための2つの正規化手法を設計した。すなわち、時空間正規化とチャネル正規化である。本手法の特長は以下の2点に集約される。(i)TDDは自動的に学習されるため、従来の手作業で設計された特徴量と比較して高い判別能力を有している。(ii)TDDは時間次元の内在的な特性を考慮し、深層学習によって得られた特徴を統合するための軌跡制約サンプリングおよびプーリング戦略を導入している。本研究では、2つの難易度の高いデータセット、HMDB51およびUCF101を用いて実験を実施した。実験結果から、TDDは従来の手作業特徴量および深層学習特徴量を上回ることを示した。さらに、これらのデータセットにおいて、最先端の手法と比較しても優れた性能を達成しており、HMDB51では65.9%、UCF101では91.5%の正確率を記録した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
軌道プールドディープコンボリューショナル記述子を用いた行動認識 | 記事 | HyperAI超神経