HyperAIHyperAI

Command Palette

Search for a command to run...

長距離動画理解のための時系列集約表現

Fadime Sener Dipika Singhania Angela Yao

概要

長期動画における将来予測は、現在および過去の観測から推論を行うことが求められる。本研究では、時間的範囲、スケーラビリティ、意味的抽象度の3つの課題に対して、柔軟な多粒度時系列集約フレームワークを提案する。最大プーリングやアテンションといったシンプルな手法を用いることで、次の行動予測および密集型予測の両面で最先端の性能を達成可能であることを示した。モデルの予測能力を検証するため、Breakfast、50Salads、EPIC-Kitchensの3つのデータセット上で実験を実施した結果、いずれにおいても最先端の結果を達成した。また、最小限の修正で本モデルは動画セグメンテーションや行動認識への拡張も可能であることが示された。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
長距離動画理解のための時系列集約表現 | 記事 | HyperAI超神経