HyperAIHyperAI

Command Palette

Search for a command to run...

VoxCeleb2-Spracherkennungsdatensatz

Date

vor 4 Jahren

Size

1.65 GB

Organization

Universität Oxford

Paper URL

arxiv.org

License

CC BY 4.0

VoxCeleb2 ist ein umfangreicher Datensatz zur Sprechererkennung, der aus Open-Source-Medien stammt und aus einer Million Korpora von mehr als 6.000 Sprechern besteht. Da der Datensatz in natürlichen Szenen gesammelt wird, mangelt es in den Sprachclips nicht an Störungen wie Lachen, Gesprächen, Kanaleffekten, Musik usw.

Das Korpus in VoxCeleb2 ist mehrsprachig und umfasst Sprecher aus 145 Ländern mit einer großen Bandbreite an Akzenten, Altersgruppen, Ethnien und Sprachen. Gleichzeitig enthält dieser Datensatz Audio und Video und eignet sich auch zur Lösung von Problemen wie visueller Sprachsynthese, Sprachtrennung, kreuzmodaler Konvertierung von Gesicht und Stimme und Video-Gesichtserkennung.

Details zum Datensatz:

VoxCeleb2.torrent
Seeding 2Downloading 0Completed 613Total Downloads 1,418
  • VoxCeleb2/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • list_test_all.txt
          34.38 MB
        • list_test_all2.txt
          68.67 MB
        • list_test_hard.txt
          101.34 MB
        • list_test_hard2.txt
          133.91 MB
        • veri_test.txt
          136.14 MB
        • veri_test2.txt
          138.37 MB
        • vox2_dev_txt.zip
          1.6 GB
        • vox2_meta.csv
          1.6 GB
        • vox2_test_txt.zip
          1.65 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp