HyperAIHyperAI
il y a 16 jours

Formation de la détection d’événements sonores sur un jeu de données hétérogène

Formation de la détection d’événements sonores sur un jeu de données hétérogène
Résumé

Former un algorithme de détection d’événements sonores sur un jeu de données hétérogène comprenant à la fois des paysages sonores enregistrés et synthétiques, pouvant présenter une granularité d’étiquetage variable, constitue une tâche non triviale pouvant entraîner la nécessité de plusieurs choix techniques. Ces choix techniques sont souvent transférés d’un système à un autre sans être remis en question. Nous proposons d’effectuer une analyse détaillée de la solution de référence (baseline) pour la tâche 4 du DCASE 2020 en détection d’événements sonores, en examinant plusieurs aspects tels que le type de données utilisées pour l’entraînement, les paramètres du modèle mean-teacher ou les transformations appliquées lors de la génération des paysages sonores synthétiques. Certains paramètres habituellement utilisés par défaut se révèlent être sous-optimaux.

Formation de la détection d’événements sonores sur un jeu de données hétérogène | Articles de recherche récents | HyperAI