HyperAIHyperAI

Command Palette

Search for a command to run...

DeepFilterNet : Amélioration en temps réel de la parole motivée par la perception

Hendrik Schröter Tobias Rosenkranz Alberto N. Escalante-B. Andreas Maier

Résumé

Les algorithmes multi-images pour l’amélioration du signal vocal mono-canal sont capables d’exploiter les corrélations à court terme présentes dans le signal vocal. La méthode Deep Filtering (DF) a été proposée afin d’estimer directement un filtre complexe dans le domaine fréquentiel, afin de tirer parti de ces corrélations. Dans ce travail, nous présentons une démonstration en temps réel d’amélioration du signal vocal basée sur DeepFilterNet. L’efficacité de DeepFilterNet repose sur l’exploitation de connaissances spécifiques à la production vocale et à la perception psychoacoustique. Notre modèle parvient à atteindre les performances des meilleures références actuelles en amélioration du signal vocal, tout en réalisant un facteur temps réel de 0,19 sur un processeur portable mono-thread. Le cadre d’implémentation ainsi que les poids pré-entraînés ont été publiés sous une licence open source.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DeepFilterNet : Amélioration en temps réel de la parole motivée par la perception | Articles | HyperAI