HyperAIHyperAI

Command Palette

Search for a command to run...

Granary Europäischer Datensatz Zur Spracherkennung Und -übersetzung

Date

vor 4 Monaten

Size

50.49 GB

Organization

NVIDIA

Paper URL

2505.13404v2

Granary ist ein umfangreicher mehrsprachiger Sprachdatensatz, der 2025 vom standortübergreifenden Forschungsteam von NVIDIA veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers lauten:Granary: Datensatz zur Spracherkennung und -übersetzung in 25 europäischen Sprachen“, dessen Ziel es ist, hochwertige Schulungs- und Evaluierungsmaterialien für mehrsprachige ASR/AST-Modelle bereitzustellen.

Dieser Datensatz enthält rund 1 Million Stunden hochwertige pseudo-gelabelte ASR-Sprachdaten aus 25 europäischen Sprachen (darunter 23 EU-Sprachen sowie Ukrainisch und Russisch). Die Daten stammen aus öffentlich zugänglichen Sprachkorpora und werden durch einen einheitlichen Pseudo-Labeling- und Qualitätsfilterprozess verarbeitet.

Zu den Sprachen gehören:

Bulgarisch, Tschechisch, Dänisch, Deutsch, Griechisch, Englisch, Spanisch, Estnisch, Finnisch, Französisch, Kroatisch, Ungarisch, Italienisch, Litauisch, Lettisch, Maltesisch, Niederländisch, Polnisch, Portugiesisch, Rumänisch, Slowakisch, Slowenisch, Schwedisch, Ukrainisch und Russisch.

Granary.torrent
Seeding 1Downloading 0Completed 50Total Downloads 73
  • Granary/
    • README.md
      1.66 KB
    • README.txt
      3.31 KB
      • data/
        • Granary.zip
          50.49 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp