HyperAIHyperAI
il y a 2 mois

LHGNN : Réseaux Neuronaux Graphiques d'Ordre Local et Supérieur pour la Classification et l'Étiquetage des Signaux Audio

Singh, Shubhr ; Benetos, Emmanouil ; Phan, Huy ; Stowell, Dan
LHGNN : Réseaux Neuronaux Graphiques d'Ordre Local et Supérieur pour la Classification et l'Étiquetage des Signaux Audio
Résumé

Les Transformers ont établi de nouveaux standards dans les tâches de traitement audio, en exploitant des mécanismes d'auto-attention pour capturer des motifs et des dépendances complexes au sein des données audio. Cependant, leur concentration sur les interactions paires limite leur capacité à traiter les relations d'ordre supérieur essentielles pour l'identification d'objets audio distincts. Pour remédier à cette limitation, cette étude introduit le Local-Higher Order Graph Neural Network (LHGNN), un modèle basé sur les graphes qui améliore la compréhension des caractéristiques en intégrant les informations du voisinage local avec des données d'ordre supérieur issues des clusters Fuzzy C-Means, permettant ainsi de capturer un spectre plus large de relations audio. L'évaluation du modèle sur trois jeux de données audio publiquement disponibles montre qu'il surpasses les modèles basés sur les Transformers sur tous les benchmarks tout en fonctionnant avec considérablement moins de paramètres. De plus, le LHGNN démontre un avantage distinct dans les scénarios où il n'y a pas de préformation sur ImageNet, établissant son efficacité et son efficience dans des environnements où des données de préformation étendues ne sont pas disponibles.

LHGNN : Réseaux Neuronaux Graphiques d'Ordre Local et Supérieur pour la Classification et l'Étiquetage des Signaux Audio | Articles de recherche récents | HyperAI