HyperAIHyperAI

Command Palette

Search for a command to run...

Résolution d'audio par réseaux neuronaux

Kuleshov Volodymyr Enam S. Zayd Ermon Stefano

Résumé

Nous présentons une nouvelle technique de traitement audio permettant d’augmenter la fréquence d’échantillonnage de signaux tels que la parole ou la musique, à l’aide de réseaux de neurones convolutifs profonds. Notre modèle est entraîné sur des paires d’exemples audio à faible et à haute qualité ; au moment de l’évaluation, il prédit les échantillons manquants dans un signal à faible résolution, selon un processus d’interpolation similaire à celui utilisé en super-résolution d’images. Notre méthode est simple et ne repose pas sur des techniques spécialisées de traitement audio. Dans nos expériences, elle dépasse les méthodes de référence sur des benchmarks standards de parole et de musique aux ratios d’agrandissement de 2x, 4x et 6x. Cette approche présente des applications pratiques dans les télécommunications, la compression audio et la génération de parole à partir de texte ; elle démontre l’efficacité des architectures convolutionnelles à propagation avant sur une tâche de génération audio.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp