Command Palette
Search for a command to run...
EnCLAP++: Analyse des EnCLAP-Frameworks zur Optimierung der Leistung automatischer Audio-Kommentierung
EnCLAP++: Analyse des EnCLAP-Frameworks zur Optimierung der Leistung automatischer Audio-Kommentierung
Jaeyeon Kim Minjeon Jeon Jaeyoon Jung Sang Hoon Woo Jinjoo Lee
Zusammenfassung
In dieser Arbeit zielen wir darauf ab, den EnCLAP-Framework, einen modernen Ansatz im Bereich der automatischen Audio-Kommentierung, zu analysieren und zu optimieren. Wir untersuchen den Einfluss von Veränderungen an den akustischen Encoder-Komponenten, erforschen das Präsentieren mit Datensätzen unterschiedlicher Skalierung und studieren die Wirksamkeit eines Reranking-Schemas. Durch umfangreiche Experimente und quantitative Analyse der generierten Caption-Texte entwickeln wir EnCLAP++, eine verbesserte Version, die die ursprüngliche Variante erheblich übertrifft.