HyperAIHyperAI

Command Palette

Search for a command to run...

VidSitu ビデオ理解データセット

Discordで議論

日付

3年前

データセット構成

南カリフォルニア大学

公開URL

vidsitu.org

Paper URL

arxiv.org

ライセンス

Other

Featured Image

VidSitu は、ビデオ内のセマンティックな役割ラベル付けのためのデータセット (VidSRL) です。 VidSitu は、2 秒単位で動詞と意味的役割の注釈が付けられた 29,000 個の 10 秒ムービークリップを含む、大規模なビデオ理解データ ソースです。エンティティは通常、フラグメントの各イベントで参照され、イベントはイベント間の関係を通じて接続されます。

VidSitu のクリップは、大規模な映画コレクション (3K) から抽出され、複雑なもの (1 つのビデオに 4.2 の固有の動詞) と多様性のあるもの (それぞれ 100 以上のタグを持つ 200 の動詞) が選択されています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています