HyperAIHyperAI

Command Palette

Search for a command to run...

VideoGraph: 動画における数分間の人類活動の認識

Noureddien Hussein Efstratios Gavves Arnold W.M. Smeulders

概要

多くの人間の活動は数分間で展開される。それらを表現するために、関連する研究では統計的なプーリングを選択することが多いが、これにより時間構造が無視されてしまう。一方、CNNやNon-Localなどの畳み込み手法を選ぶ研究もある。これらの手法は時間概念の学習に成功しているものの、数分間にわたる時間依存性をモデル化するには不足している。本稿では、VideoGraphという方法を提案し、両者の長所を活かすことを目指す:数分間続く人間の活動を表現し、その潜在的な時間構造を学習する。VideoGraphは、人間の活動に対するグラフベースの表現を学習する。このグラフとそのノードやエッジは、完全にビデオデータセットから学習されるため、ノードレベルのアノテーションがない問題にも適用可能である。結果として、Epic-KitchensおよびBreakfastベンチマークにおいて関連研究よりも改善が見られた。さらに、VideoGraphが数分間のビデオにおいて人間の活動の時間構造を学習できることが示された。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
VideoGraph: 動画における数分間の人類活動の認識 | 記事 | HyperAI超神経