HyperAIHyperAI

Command Palette

Search for a command to run...

Granary Europäischer Datensatz Zur Spracherkennung Und -übersetzung

Datum

vor 3 Monaten

Größe

50.49 GB

Organisation

NVIDIA

Paper-URL

2505.13404v2

Granary ist ein umfangreicher mehrsprachiger Sprachdatensatz, der 2025 vom standortübergreifenden Forschungsteam von NVIDIA veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers lauten:Granary: Datensatz zur Spracherkennung und -übersetzung in 25 europäischen Sprachen“, dessen Ziel es ist, hochwertige Schulungs- und Evaluierungsmaterialien für mehrsprachige ASR/AST-Modelle bereitzustellen.

Dieser Datensatz enthält rund 1 Million Stunden hochwertige pseudo-gelabelte ASR-Sprachdaten aus 25 europäischen Sprachen (darunter 23 EU-Sprachen sowie Ukrainisch und Russisch). Die Daten stammen aus öffentlich zugänglichen Sprachkorpora und werden durch einen einheitlichen Pseudo-Labeling- und Qualitätsfilterprozess verarbeitet.

Zu den Sprachen gehören:

Bulgarisch, Tschechisch, Dänisch, Deutsch, Griechisch, Englisch, Spanisch, Estnisch, Finnisch, Französisch, Kroatisch, Ungarisch, Italienisch, Litauisch, Lettisch, Maltesisch, Niederländisch, Polnisch, Portugiesisch, Rumänisch, Slowakisch, Slowenisch, Schwedisch, Ukrainisch und Russisch.

Granary.torrent
Seeding 1Herunterladen 0Abgeschlossen 12Gesamtdownloads 35
  • Granary/
    • README.md
      1.66 KB
    • README.txt
      3.31 KB
      • data/
        • Granary.zip
          50.49 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp