HyperAIHyperAI
vor 9 Tagen

Das NTT DCASE2020 Challenge Task 6 System: Automatisierte Audio-Kommentierung mit Schlüsselwort- und Satzlängenschätzung

Yuma Koizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino
Das NTT DCASE2020 Challenge Task 6 System: Automatisierte Audio-Kommentierung mit Schlüsselwort- und Satzlängenschätzung
Abstract

Dieser technische Bericht beschreibt das System, das am Wettbewerb Detection and Classification of Acoustic Scenes and Events (DCASE) 2020, Aufgabe 6: automatisierte Audio-Beschreibung, teilnahm. Unsere Einreichung konzentriert sich auf die Lösung zweier Unbestimmtheitsprobleme im Bereich der automatisierten Audio-Beschreibung: der Unbestimmtheit bei der Wortauswahl und der Unbestimmtheit der Satzlänge. Wir lösen diese beiden Hauptprobleme sowie die zugehörigen Unterprobleme gleichzeitig, indem wir Schlüsselwörter und Satzlänge mittels Mehraufgaben-Lernens schätzen. Wir testeten eine vereinfachte Version unseres Modells anhand des Entwicklungstestdatensatzes. Unser Modell erzielte eine SPIDEr-Score von 20,7, während der Baseline-System einen Score von 5,4 erreichte.

Das NTT DCASE2020 Challenge Task 6 System: Automatisierte Audio-Kommentierung mit Schlüsselwort- und Satzlängenschätzung | Neueste Forschungsarbeiten | HyperAI