Command Palette

Search for a command to run...

VidSitu ビデオ理解データセット

日付

3年前

組織

南カリフォルニア大学

公開URL

vidsitu.org

論文URL

arxiv.org

ライセンス

その他

Discordコミュニティに参加
Featured Image

VidSitu は、ビデオ内のセマンティックな役割ラベル付けのためのデータセット (VidSRL) です。 VidSitu は、2 秒単位で動詞と意味的役割の注釈が付けられた 29,000 個の 10 秒ムービークリップを含む、大規模なビデオ理解データ ソースです。エンティティは通常、フラグメントの各イベントで参照され、イベントはイベント間の関係を通じて接続されます。

VidSitu のクリップは、大規模な映画コレクション (3K) から抽出され、複雑なもの (1 つのビデオに 4.2 の固有の動詞) と多様性のあるもの (それぞれ 100 以上のタグを持つ 200 の動詞) が選択されています。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
VidSitu ビデオ理解データセット | データセット | HyperAI超神経