HyperAIHyperAI

Command Palette

Search for a command to run...

VoxCeleb2-Spracherkennungsdatensatz

Datum

vor 3 Jahren

Größe

1.65 GB

Organisation

Universität Oxford

Veröffentlichungs-URL

www.robots.ox.ac.uk

Paper-URL

arxiv.org

Lizenz

CC BY 4.0

VoxCeleb2 ist ein umfangreicher Datensatz zur Sprechererkennung, der aus Open-Source-Medien stammt und aus einer Million Korpora von mehr als 6.000 Sprechern besteht. Da der Datensatz in natürlichen Szenen gesammelt wird, mangelt es in den Sprachclips nicht an Störungen wie Lachen, Gesprächen, Kanaleffekten, Musik usw.

Das Korpus in VoxCeleb2 ist mehrsprachig und umfasst Sprecher aus 145 Ländern mit einer großen Bandbreite an Akzenten, Altersgruppen, Ethnien und Sprachen. Gleichzeitig enthält dieser Datensatz Audio und Video und eignet sich auch zur Lösung von Problemen wie visueller Sprachsynthese, Sprachtrennung, kreuzmodaler Konvertierung von Gesicht und Stimme und Video-Gesichtserkennung.

Details zum Datensatz:

VoxCeleb2.torrent
Seeding 3Herunterladen 0Abgeschlossen 589Gesamtdownloads 1,353
  • VoxCeleb2/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • list_test_all.txt
          34.38 MB
        • list_test_all2.txt
          68.67 MB
        • list_test_hard.txt
          101.34 MB
        • list_test_hard2.txt
          133.91 MB
        • veri_test.txt
          136.14 MB
        • veri_test2.txt
          138.37 MB
        • vox2_dev_txt.zip
          1.6 GB
        • vox2_meta.csv
          1.6 GB
        • vox2_test_txt.zip
          1.65 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp