ダウンロード

Discordで議論

日付

4年前

サイズ

1.65 GB

データセット構成

公開URL

www.robots.ox.ac.uk

論文URL

ライセンス

CC BY 4.0

タグ

マルチモーダル

音声および音声処理

オブジェクト認識

VoxCeleb2 は、オープンソースメディアから派生した大規模な話者認識データセットで、6,000 人を超える話者からの 100 万コーパスで構成されています。このデータセットは自然のシーンで収集されたため、スピーチクリップには笑い、会話、チャンネル効果、音楽などの多くの干渉が含まれています。 VoxCeleb2 のコーパスは多言語対応であり、145 か国の話者が幅広いアクセント、年齢、人種、言語をカバーしています。同時に、データセットにはオーディオとビデオが含まれており、視覚的な音声合成、音声分離、顔と音声のクロスモーダル変換、ビデオ顔認識などの問題を解決するのにも適しています。 データセットの詳細:

VoxCeleb2.torrent

シーディング 2ダウンロード中 0完了 651総ダウンロード数 1,474

VoxCeleb2/
- README.md
  1.41 KB
- README.txt
  2.82 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

ダウンロード

Discordで議論

日付

4年前

サイズ

1.65 GB

データセット構成

公開URL

www.robots.ox.ac.uk

論文URL

arxiv.org

ライセンス

CC BY 4.0

タグ

マルチモーダル

音声および音声処理

オブジェクト認識

VoxCeleb2 は、オープンソースメディアから派生した大規模な話者認識データセットで、6,000 人を超える話者からの 100 万コーパスで構成されています。このデータセットは自然のシーンで収集されたため、スピーチクリップには笑い、会話、チャンネル効果、音楽などの多くの干渉が含まれています。 VoxCeleb2 のコーパスは多言語対応であり、145 か国の話者が幅広いアクセント、年齢、人種、言語をカバーしています。同時に、データセットにはオーディオとビデオが含まれており、視覚的な音声合成、音声分離、顔と音声のクロスモーダル変換、ビデオ顔認識などの問題を解決するのにも適しています。 データセットの詳細:

VoxCeleb2.torrent

シーディング 2ダウンロード中 0完了 651総ダウンロード数 1,474

VoxCeleb2/
- README.md
  1.41 KB
- README.txt
  2.82 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています