HyperAIHyperAI

Command Palette

Search for a command to run...

ビデオから抽出された人間と物体の相互作用のホットスポット

Tushar Nagarajan* UT Austin [email protected] Christoph Feichtenhofer Facebook AI Research [email protected] Kristen Grauman Facebook AI Research [email protected]

概要

物体との対話の学習は、体現された視覚的知能への重要な一歩ですが、既存の技術は重い監督やセンシング要件に苦しんでいます。本研究では、ビデオから直接人間-物体対話の「ホットスポット」を学習する手法を提案します。アフォーダンスを手動で監督されたセマンティックセグメンテーションタスクとして扱うのではなく、当手法は実際の人間の行動を記録したビデオを見ることによって対話を学習し、可能となるアクションを予測します。新しい画像やビデオが与えられた場合、当モデルは物体がどのように操作されるかを示す空間的なホットスポットマップを推論します——たとえその物体が現在静止している場合でもです。第一人称および第三者称のビデオによる結果を通じて、実際の人間-物体対話に基づくアフォーダンスの有用性を示しています。当研究で得られた弱い監督下でのホットスポットは、強い監督下でのアフォーダンス手法と競合するだけでなく、未知の物体カテゴリに対する対話も予測できます。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています