HyperAIHyperAI
il y a 2 mois

Amélioration de la Résolution Audio à l'Aide des Réseaux Neuronaux

Kuleshov, Volodymyr ; Enam, S. Zayd ; Ermon, Stefano
Amélioration de la Résolution Audio à l'Aide des Réseaux Neuronaux
Résumé

Nous présentons une nouvelle technique de traitement audio qui augmente le taux d'échantillonnage des signaux tels que la parole ou la musique en utilisant des réseaux neuronaux convolutifs profonds. Notre modèle est formé sur des paires d'exemples audio de faible et haute qualité ; lors des tests, il prédit les échantillons manquants au sein d'un signal à faible résolution dans un processus d'interpolation similaire à la super-résolution d'images. Notre méthode est simple et ne nécessite pas l'utilisation de techniques de traitement audio spécialisées ; dans nos expériences, elle surpassait les méthodes de base sur des benchmarks standard de parole et de musique pour des rapports d'upsampling de 2x, 4x et 6x. Cette méthode a des applications pratiques dans les domaines de la téléphonie, de la compression et de la génération de discours à partir du texte ; elle démontre l'efficacité des architectures convolutives feed-forward sur une tâche de génération audio.

Amélioration de la Résolution Audio à l'Aide des Réseaux Neuronaux | Articles de recherche récents | HyperAI