il y a 8 mois

Résumé

L'introduction de grands ensembles de données audio, tels qu'AudioSet, a ouvert la voie aux Transformers pour conquérir le domaine audio et remplacer les CNNs comme l'architecture de réseau neuronal de pointe pour de nombreuses tâches. Les Transformers d'audio spectrogramme sont excellents pour exploiter de grands ensembles de données, créant des modèles pré-entraînés puissants qui surpassent les CNNs lorsqu'ils sont affinés sur des tâches en aval. Cependant, les Transformers d'audio spectrogramme actuellement populaires sont exigeants en termes de complexité computationnelle par rapport aux CNNs. Récemment, nous avons démontré que, grâce à la distillation de connaissances Transformer vers CNN, des CNNs efficaces peuvent rattraper et même surpasser les Transformers sur de grands ensembles de données. Dans ce travail, nous prolongeons cette ligne de recherche et augmentons la capacité des CNNs efficaces en introduisant des blocs CNN dynamiques, composés de non-linéarités dynamiques, convolutions dynamiques et mécanismes d'attention. Nous montrons que ces CNNs dynamiques surpassent les CNNs traditionnels efficaces en termes d'échange performance-complexité et d'efficacité paramétrique dans la tâche d'étiquetage audio à grande échelle sur AudioSet. Nos expériences indiquent également que les CNNs dynamiques introduits atteignent une meilleure performance sur les tâches en aval et se développent bien, atteignant les performances des Transformers et même les surpassant sur AudioSet et plusieurs tâches en aval.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Réseau De Neurones Convolutif

Traitement Audio Et Vocal

Florian Schmid Khaled Koutini Gerhard Widmer

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Réseau De Neurones Convolutif

Traitement Audio Et Vocal

Florian Schmid Khaled Koutini Gerhard Widmer

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Réseaux Neuronaux Convolutifs Dynamiques en tant que Modèles Audio Pré-entraînés Efficaces

Florian Schmid Khaled Koutini Gerhard Widmer

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Réseaux Neuronaux Convolutifs Dynamiques en tant que Modèles Audio Pré-entraînés Efficaces

Florian Schmid Khaled Koutini Gerhard Widmer

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Réseaux Neuronaux Convolutifs Dynamiques en tant que Modèles Audio Pré-entraînés Efficaces

Florian Schmid Khaled Koutini Gerhard Widmer

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters