AVA アクション認識データセット

日付

3年前

サイズ

52.82 MB

組織

公開URL

research.google.com

論文URL

arxiv.org

ライセンス

CC BY 4.0

タグ

AVA (Atomic Visual Actions の正式名) は、ロボットが人間の活動を理解できるように訓練するために設計された、オーディオビジュアルの注釈を備えたビデオデータセットです。各ビデオクリップにはアノテーターによって詳細な注釈が付けられており、これらの注釈はさまざまなシーン、録画状況、人間の活動の表現を反映しています。

データセットの注釈には次のものが含まれます。

キネティクス (AVA-Kinetics): AVA と Kinetics を組み合わせたものです。より広範囲のビジュアルシーンにローカライズされたアクションタグを提供するために、著者は Kinetics-700 ビデオに AVA アクションタグを提供しました。アノテーションの総数はほぼ 2 倍になり、特定の種類のビデオの数は 500 以上増加しました。回。
アクション (AvA-Actions): AVA データセットは、430 個の 15 分のムービークリップ内の 80 個のアトミックなビジュアルアクションに密に注釈を付けます。これらのアクションは空間と時間内に配置され、結果として 162 万個のアクションラベルが作成され、そのうちの多数のラベルが適用されます。頻繁に。
音声アクティビティ (AVA ActiveSpeaker、AVA Speech): AVA ActiveSpeaker は、AVA v1.0 ビデオ内のサウンドと表示される顔を接続し、約 39,000 の顔に 365 万のフレームをマークします。 AVA Speech は、AVA v1.0 ビデオの音声アクティビティに密に注釈を付け、3 つの背景雑音条件に明示的に注釈を付けます。その結果、45 時間にわたる約 4,600 の注釈付きクリップが得られます。

AVA.torrent

シーディング 2ダウンロード中 0ダウンロード完了 657総ダウンロード数 706

AVA/
- README.md
  1.9 KB
- README.txt
  3.79 KB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング

すぐに使える GPU

最適価格

今すぐ始める

Hyper Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

AVA アクション認識データセット

AI で AI を構築

Hyper Newsletters