HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Reconnaissance Vocale Et De Traduction Européennes Granary

Date

il y a 3 mois

Taille

50.49 GB

Organisation

NVIDIA

URL de l'article

2505.13404v2

Granary est un ensemble de données vocales multilingues à grande échelle publié par l'équipe de recherche multisite de NVIDIA en 2025. Les résultats de l'article associé sont «Granary : ensemble de données de reconnaissance vocale et de traduction dans 25 langues européennes", qui vise à fournir du matériel de formation et d'évaluation de haute qualité pour les modèles ASR/AST multilingues.

Cet ensemble de données contient environ un million d'heures de données vocales ASR pseudo-étiquetées de haute qualité, couvrant 25 langues européennes (dont 23 langues de l'UE, ainsi que l'ukrainien et le russe). Ces données proviennent de corpus vocaux accessibles au public et sont traitées selon un processus unifié de pseudo-étiquetage et de filtrage qualité.

Les langues incluent :

Bulgare, tchèque, danois, allemand, grec, anglais, espagnol, estonien, finnois, français, croate, hongrois, italien, lituanien, letton, maltais, néerlandais, polonais, portugais, roumain, slovaque, slovène, suédois, ukrainien et russe.

Granary.torrent
Partage 1Téléchargement 0Terminés 12Téléchargements totaux 35
  • Granary/
    • README.md
      1.66 KB
    • README.txt
      3.31 KB
      • data/
        • Granary.zip
          50.49 GB

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp