HyperAIHyperAI

Command Palette

Search for a command to run...

VoxCeleb2 音声認識データセット

日付

4年前

サイズ

1.65 GB

データセット構成

Paper URL

arxiv.org

ライセンス

CC BY 4.0

VoxCeleb2 は、オープンソース メディアから派生した大規模な話者認識データ セットで、6,000 人を超える話者からの 100 万コーパスで構成されています。このデータ セットは自然のシーンで収集されたため、スピーチ クリップには笑い、会話、チャンネル効果、音楽などの多くの干渉が含まれています。 VoxCeleb2 のコーパスは多言語対応であり、145 か国の話者が幅広いアクセント、年齢、人種、言語をカバーしています。同時に、データセットにはオーディオとビデオが含まれており、視覚的な音声合成、音声分離、顔と音声のクロスモーダル変換、ビデオ顔認識などの問題を解決するのにも適しています。 データセットの詳細:

VoxCeleb2.torrent
シーディング 2ダウンロード中 0完了 651総ダウンロード数 1,474
  • VoxCeleb2/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • veri_test.txt
          136.14 MB
        • vox2_meta.csv
          1.6 GB
        • veri_test2.txt
          138.37 MB
        • vox2_dev_txt.zip
          1.6 GB
        • list_test_all.txt
          34.38 MB
        • vox2_test_txt.zip
          1.65 GB
        • list_test_all2.txt
          68.67 MB
        • list_test_hard.txt
          101.34 MB
        • list_test_hard2.txt
          133.91 MB

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています