HyperAIHyperAI

Command Palette

Search for a command to run...

EfficientLEAF : Une Interface Audio Apprenable Plus Rapide d'Utilité Discutable

Author Name

Résumé

Dans le domaine de la classification audio, les bancs de filtres auditifs différentiables avec peu de paramètres occupent une position intermédiaire entre les spectrogrammes codés en dur et l'audio brut. LEAF (arXiv:2101.08596), un banc de filtres basé sur les fonctions de Gabor combinées à la Normalisation d'Énergie par Canal (PCEN), a montré des résultats prometteurs, mais il est coûteux sur le plan computationnel. En utilisant des tailles et des pas de convolution inhomogènes et en remplaçant le PCEN par des opérations mieux parallélisables, nous pouvons atteindre des résultats similaires de manière plus efficace. Dans des expériences menées sur six tâches de classification audio, notre frontend atteint une précision comparable à celle de LEAF à seulement 3% du coût, mais ni l'un ni l'autre ne parviennent à surpasser systématiquement un banc de filtres mel fixe. La quête d'une frontend audio apprenable n'est donc pas encore résolue.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
EfficientLEAF : Une Interface Audio Apprenable Plus Rapide d'Utilité Discutable | Articles | HyperAI