Date

il y a 10 mois

Organisation

URL du document

2506.04152

Licence

CC BY 4.0

Balises

Reconnaissance Vocale

Text-to-Audio

HiFiTTS-2 est un ensemble de données vocales à large bande passante à grande échelle publié par NVIDIA en 2025. Les résultats de l'article associé sont « HiFiTTS-2 : un ensemble de données vocales à large bande passante et à grande échelle », conçu pour soutenir la formation et l'évaluation de modèles de synthèse vocale (TTS) à zéro coup de haute qualité. Cet ensemble de données contient des métadonnées audio de 5 000 locuteurs, soit environ 36 700 heures d'enregistrements de discours en anglais à 22,05 kHz et 31 700 heures à 44,1 kHz, classées par qualité de bande passante et fréquence d'échantillonnage. Ces données proviennent des livres audio LibriVox, téléchargeables sur le site. Elles sont échantillonnées à 48 kHz, ce qui les rend adaptées à l'apprentissage de vocodeurs haute résolution et de modèles de synthèse vocale non autorégressive.

Les données comprennent :

Audio vocal (22 kHz / 44 kHz, mono)
Transcription et métadonnées du chapitre/épisode
Estimation de la qualité du locuteur et de la bande passante, horodatage de segmentation
Manifestes de formation/validation et exemples de configurations

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

il y a 3 mois

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

il y a 2 mois

Ensemble De Données EEG THINGS-EEG

il y a 5 mois

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

il y a 5 mois

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

il y a 5 mois

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

il y a 5 mois

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

il y a 5 mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a 5 mois

Ensemble De Données De Détection De Contrebande Par Rayons X

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Discuter sur Discord

Date

il y a 10 mois

Organisation

URL du document

2506.04152

Licence

CC BY 4.0

Balises

Reconnaissance Vocale

Text-to-Audio