Sound Event Detection in domestischen Umgebungen mit schwach beschrifteten Daten und Soundscape-Synthese

Diese Arbeit präsentiert Task 4 der Detection and Classification of Acoustic Scenes and Events (DCASE) 2019 Challenge und liefert eine erste Analyse der Ergebnisse dieser Herausforderung. Der Task ist eine Fortsetzung von Task 4 der DCASE 2018 Challenge und befasst sich mit der Entwicklung von Systemen zur großskaligen Detektion von Schallereignissen unter Verwendung einer Kombination aus schwach beschrifteten Daten – also Trainingslabels ohne zeitliche Grenzen – und stark beschrifteten, synthetischen Daten. In der Arbeit wird das Domestic Environment Sound Event Detection (DESED)-Datensatz vorgestellt, der einen Teil des Datensatzes aus dem Vorjahr sowie einen zusätzlichen, synthetischen, stark beschrifteten Datensatz enthält, der in diesem Jahr bereitgestellt wurde und ausführlicher beschrieben wird. Zudem werden die Leistungen der eingereichten Systeme auf den offiziellen Evaluierungs- (Test-) und Entwicklungsdatensätzen sowie auf mehreren zusätzlichen Datensätzen berichtet. Die besten Systeme dieses Jahres erreichen eine F-Maß-Verbesserung um etwa 10 Prozentpunkte gegenüber dem Gewinner-System des Vorjahres.