Command Palette
Search for a command to run...
Das NTT DCASE2020 Challenge Task 6 System: Automatisierte Audio-Kommentierung mit Schlüsselwort- und Satzlängenschätzung
Das NTT DCASE2020 Challenge Task 6 System: Automatisierte Audio-Kommentierung mit Schlüsselwort- und Satzlängenschätzung
Yuma Koizumi Daiki Takeuchi Yasunori Ohishi Noboru Harada Kunio Kashino
Zusammenfassung
Dieser technische Bericht beschreibt das System, das am Wettbewerb Detection and Classification of Acoustic Scenes and Events (DCASE) 2020, Aufgabe 6: automatisierte Audio-Beschreibung, teilnahm. Unsere Einreichung konzentriert sich auf die Lösung zweier Unbestimmtheitsprobleme im Bereich der automatisierten Audio-Beschreibung: der Unbestimmtheit bei der Wortauswahl und der Unbestimmtheit der Satzlänge. Wir lösen diese beiden Hauptprobleme sowie die zugehörigen Unterprobleme gleichzeitig, indem wir Schlüsselwörter und Satzlänge mittels Mehraufgaben-Lernens schätzen. Wir testeten eine vereinfachte Version unseres Modells anhand des Entwicklungstestdatensatzes. Unser Modell erzielte eine SPIDEr-Score von 20,7, während der Baseline-System einen Score von 5,4 erreichte.