HyperAIHyperAI

Command Palette

Search for a command to run...

VoxCeleb2 音声認識データセット

日付

4年前

サイズ

1.65 GB

データセット構成

オックスフォード大学

Paper URL

arxiv.org

ライセンス

CC BY 4.0

VoxCeleb2 は、オープンソース メディアから派生した大規模な話者認識データ セットで、6,000 人を超える話者からの 100 万コーパスで構成されています。このデータ セットは自然のシーンで収集されたため、スピーチ クリップには笑い、会話、チャンネル効果、音楽などの多くの干渉が含まれています。

VoxCeleb2 のコーパスは多言語対応であり、145 か国の話者が幅広いアクセント、年齢、人種、言語をカバーしています。同時に、データセットにはオーディオとビデオが含まれており、視覚的な音声合成、音声分離、顔と音声のクロスモーダル変換、ビデオ顔認識などの問題を解決するのにも適しています。

データセットの詳細:

VoxCeleb2.torrent
シーディング 2ダウンロード中 0完了 633総ダウンロード数 1,442
  • VoxCeleb2/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • list_test_all.txt
          34.38 MB
        • list_test_all2.txt
          68.67 MB
        • list_test_hard.txt
          101.34 MB
        • list_test_hard2.txt
          133.91 MB
        • veri_test.txt
          136.14 MB
        • veri_test2.txt
          138.37 MB
        • vox2_dev_txt.zip
          1.6 GB
        • vox2_meta.csv
          1.6 GB
        • vox2_test_txt.zip
          1.65 GB

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています