日付

7年前

サイズ

867.36 GB

データセット構成

公開URL

looking-to-listen.github.io

タグ

自然言語処理

AVSpeech は、気を散らす背景ノイズのない音声ビデオクリップで構成される新しい大規模な視聴覚データセットです。クリップの長さは 3 ～ 10 秒で、各クリップのサウンドトラックで聞こえる声は、ビデオに表示されている唯一の人物が話しているものです。このデータセットには、さまざまな人物、言語、顔のポーズをカバーする 290,000 本の YouTube ビデオからの約 4,700 時間のビデオクリップが含まれています。

AVSpeech.torrent

シーディング 3ダウンロード中 1完了 2,861総ダウンロード数 4,571

AVSpeech/
- data.z01
  97.91 GB
- data.z02
  195.56 GB
- data.z03
  293.22 GB
- data.z04
  390.88 GB
- data.z05
  488.53 GB
- data.z06
  586.19 GB
- data.z07
  683.84 GB
- data.z08
  781.5 GB
- data.zip
  867.35 GB
- README.md
  1.17 KB
- README.txt
  2.34 KB
- download.sh
  867.35 GB
- avspeech_train.csv
  128.33 MB
- avspeech_train.part0.csv
  153.99 MB
- avspeech_train.part1.csv
  179.66 MB
- avspeech_train.part2.csv
  205.33 MB
- avspeech_train.part3.csv
  230.99 MB
- avspeech_train.part4.csv
  256.66 MB
- parallel-20190822.tar.bz2
  867.35 GB
- parallel-20190822.tar.bz2.sig
  867.35 GB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット

5ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

7年前

サイズ

867.36 GB

データセット構成

公開URL

looking-to-listen.github.io

タグ

自然言語処理

AVSpeech.torrent

シーディング 3ダウンロード中 1完了 2,861総ダウンロード数 4,571

AVSpeech/
- data.z01
  97.91 GB
- data.z02
  195.56 GB
- data.z03
  293.22 GB
- data.z04
  390.88 GB
- data.z05
  488.53 GB
- data.z06
  586.19 GB
- data.z07
  683.84 GB
- data.z08
  781.5 GB
- data.zip
  867.35 GB
- README.md
  1.17 KB
- README.txt
  2.34 KB
- download.sh
  867.35 GB
- avspeech_train.csv
  128.33 MB
- avspeech_train.part0.csv
  153.99 MB
- avspeech_train.part1.csv
  179.66 MB
- avspeech_train.part2.csv
  205.33 MB
- avspeech_train.part3.csv
  230.99 MB
- avspeech_train.part4.csv
  256.66 MB
- parallel-20190822.tar.bz2
  867.35 GB
- parallel-20190822.tar.bz2.sig
  867.35 GB

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット

5ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

AVSpeech – オーディオビジュアル音声データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

AVSpeech – オーディオビジュアル音声データセット

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

AVSpeech – オーディオビジュアル音声データセット

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット

AIでAIを構築

HyperAI Newsletters

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット