HyperAIHyperAI

Command Palette

Search for a command to run...

Flux Auditifs Lents-Rapides Pour la Reconnaissance Audio

Evangelos Kazakos Arsha Nagrani Andrew Zisserman Dima Damen

Résumé

Nous proposons un réseau de neurones convolutif à deux flux pour la reconnaissance audio, qui opère sur des entrées de spectrogrammes temps-fréquence. En nous inspirant des succès similaires dans le domaine de la reconnaissance visuelle, nous apprenons des flux auditifs Lents-Rapides avec des convolutions séparables et des connexions latérales multiniveaux. Le flux Lent dispose d'une grande capacité de canaux tandis que le flux Rapide fonctionne à une résolution temporelle fine. Nous mettons en évidence l'importance de notre proposition à deux flux sur deux jeux de données variés : VGG-Sound et EPIC-KITCHENS-100, et obtenons des résultats d'état de l'art sur les deux.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Flux Auditifs Lents-Rapides Pour la Reconnaissance Audio | Articles | HyperAI