HyperAIHyperAI

Command Palette

Search for a command to run...

WildDESED : Un jeu de données alimenté par un LLM pour le système de détection d’événements sonores dans les environnements domestiques sauvages

Yang Xiao Rohan Kumar Das

Résumé

Ce travail vise à faire progresser la recherche sur la détection d'événements sonores (SED) en présentant un nouveau jeu de données alimenté par un grand modèle linguistique (LLM), nommé WildDESED, pour la détection d'événements sonores dans des environnements domestiques sauvages. Il est conçu comme une extension du jeu de données DESED original afin de refléter une variabilité acoustique diversifiée et des bruits complexes dans les habitats domestiques. Nous avons exploité des LLMs pour générer huit scénarios domestiques différents basés sur les catégories cibles de sons du jeu de données DESED. Ensuite, nous avons enrichi ces scénarios avec un mélange soigneusement ajusté de bruits sélectionnés dans AudioSet, en veillant à ce qu'il n'y ait aucun chevauchement avec les sons cibles. Nous considérons le réseau neuronal convolutif récurrent largement utilisé pour étudier le jeu de données WildDESED, qui illustre sa nature complexe et difficile. Nous appliquons ensuite l'apprentissage par curriculum en augmentant progressivement la complexité des bruits pour améliorer les capacités de généralisation du modèle à différents niveaux de bruit. Nos résultats avec cette approche montrent des améliorations dans l'environnement bruyant, validant ainsi l'efficacité du jeu de données WildDESED et favorisant les progrès en matière de SED robuste au bruit.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp