HyperAIHyperAI

Command Palette

Search for a command to run...

Das NTT DCASE2020 Challenge Task 6 System: Automatisierte Audio-Kommentierung mit Schlüsselwort- und Satzlängenschätzung

Yuma Koizumi Daiki Takeuchi Yasunori Ohishi Noboru Harada Kunio Kashino

Zusammenfassung

Dieser technische Bericht beschreibt das System, das am Wettbewerb Detection and Classification of Acoustic Scenes and Events (DCASE) 2020, Aufgabe 6: automatisierte Audio-Beschreibung, teilnahm. Unsere Einreichung konzentriert sich auf die Lösung zweier Unbestimmtheitsprobleme im Bereich der automatisierten Audio-Beschreibung: der Unbestimmtheit bei der Wortauswahl und der Unbestimmtheit der Satzlänge. Wir lösen diese beiden Hauptprobleme sowie die zugehörigen Unterprobleme gleichzeitig, indem wir Schlüsselwörter und Satzlänge mittels Mehraufgaben-Lernens schätzen. Wir testeten eine vereinfachte Version unseres Modells anhand des Entwicklungstestdatensatzes. Unser Modell erzielte eine SPIDEr-Score von 20,7, während der Baseline-System einen Score von 5,4 erreichte.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp