il y a 6 mois

Résumé

Les modèles récents de reconnaissance vocale (speech-to-text) nécessitent généralement de grandes ressources matérielles et sont principalement entraînés en anglais. Ce papier présente des modèles de reconnaissance vocale pour l’allemand, ainsi que pour l’espagnol et le français, dotés de caractéristiques spécifiques : (a) Ils sont de petite taille et fonctionnent en temps réel sur des microcontrôleurs tels qu’un Raspberry Pi. (b) En s’appuyant sur un modèle pré-entraîné en anglais, ils peuvent être entraînés sur du matériel grand public avec un jeu de données relativement réduit. (c) Ces modèles sont compétitifs par rapport à d’autres solutions et surpassent ces dernières en allemand. À cet égard, les modèles combinent les avantages d’approches existantes, chacune desquelles ne possède qu’un sous-ensemble des fonctionnalités proposées ici. En outre, le papier introduit une nouvelle bibliothèque pour la gestion des jeux de données, conçue pour une extension facile avec de nouveaux jeux de données, et propose une méthode optimisée pour le transfert d’apprentissage vers de nouvelles langues à l’aide d’un modèle pré-entraîné provenant d’une langue à alphabet similaire.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Traitement Audio Et Vocal

Transformer

Traitement Du Langage Naturel

Approche/Framework

Traitement Du Langage Naturel

Audio

Tâche

Daniel Bermuth Alexander Poeppel Wolfgang Reif

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Traitement Audio Et Vocal

Transformer

Traitement Du Langage Naturel

Approche/Framework

Traitement Du Langage Naturel

Audio

Tâche

Daniel Bermuth Alexander Poeppel Wolfgang Reif

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Scribosermo : Modèles rapides de reconnaissance vocale en texte pour l'allemand et d'autres langues

Daniel Bermuth Alexander Poeppel Wolfgang Reif

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Scribosermo : Modèles rapides de reconnaissance vocale en texte pour l'allemand et d'autres langues

Daniel Bermuth Alexander Poeppel Wolfgang Reif

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Scribosermo : Modèles rapides de reconnaissance vocale en texte pour l'allemand et d'autres langues

Daniel Bermuth Alexander Poeppel Wolfgang Reif

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters