il y a 8 mois

Résumé

Nous étudions les capacités des systèmes de traitement de la parole formés simplement à prédire de grandes quantités de transcriptions d'audio sur Internet. Lorsqu'ils sont mis à l'échelle jusqu'à 680 000 heures de supervision multilingue et multitâche, les modèles résultants généralisent bien aux benchmarks standards et sont souvent compétitifs avec les résultats précédemment supervisés, mais dans un contexte de transfert zéro-shot sans nécessité d'ajustement fin. Comparés aux humains, ces modèles approchent leur précision et leur robustesse. Nous mettons à disposition des modèles et du code d'inférence pour servir de base à des travaux ultérieurs sur le traitement robuste de la parole.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Traitement Audio Et Vocal

Apprentissage Multi-tâches

Reconnaissance Vocale

Approche/Framework

Audio

Tâche

Radford Alec ; Kim Jong Wook ; Xu Tao ; Brockman Greg ; McLeavey Christine ; Sutskever Ilya

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Reconnaissance robuste de la parole par supervision faible à grande échelle

Radford Alec ; Kim Jong Wook ; Xu Tao ; Brockman Greg ; McLeavey Christine ; Sutskever Ilya

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Reconnaissance robuste de la parole par supervision faible à grande échelle

Radford Alec ; Kim Jong Wook ; Xu Tao ; Brockman Greg ; McLeavey Christine ; Sutskever Ilya

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Reconnaissance robuste de la parole par supervision faible à grande échelle

Radford Alec ; Kim Jong Wook ; Xu Tao ; Brockman Greg ; McLeavey Christine ; Sutskever Ilya

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters