Détection d’événements sonores dans des environnements domestiques à l’aide de données faiblement étiquetées et de synthèse de paysage sonore

Ce papier présente la tâche 4 du défi Detection and Classification of Acoustic Scenes and Events (DCASE) 2019, ainsi qu’une première analyse des résultats obtenus. Cette tâche constitue une suite à la tâche 4 du défi DCASE 2018, et consiste à entraîner des systèmes pour la détection à grande échelle d’événements sonores à l’aide d’un ensemble de données faiblement étiquetées — c’est-à-dire des étiquettes d’entraînement sans bornes temporelles — combinées à des données synthétiques fortement étiquetées. Le papier introduit le jeu de données Domestic Environment Sound Event Detection (DESED), qui combine une partie du jeu de données de l’année précédente avec un nouveau jeu de données synthétique, fortement étiqueté, fourni cette année, que nous décrivons plus en détail. Nous rapportons également les performances des systèmes soumis sur les ensembles de test officiels (évaluation) et de développement, ainsi que sur plusieurs autres jeux de données. Les meilleurs systèmes de cette année surpassent celui qui avait remporté le défi l’année dernière d’environ 10 points de F-mesure.