HyperAIHyperAI
vor 17 Tagen

EnCLAP++: Analyse des EnCLAP-Frameworks zur Optimierung der Leistung automatischer Audio-Kommentierung

Jaeyeon Kim, Minjeon Jeon, Jaeyoon Jung, Sang Hoon Woo, Jinjoo Lee
EnCLAP++: Analyse des EnCLAP-Frameworks zur Optimierung der Leistung automatischer Audio-Kommentierung
Abstract

In dieser Arbeit zielen wir darauf ab, den EnCLAP-Framework, einen modernen Ansatz im Bereich der automatischen Audio-Kommentierung, zu analysieren und zu optimieren. Wir untersuchen den Einfluss von Veränderungen an den akustischen Encoder-Komponenten, erforschen das Präsentieren mit Datensätzen unterschiedlicher Skalierung und studieren die Wirksamkeit eines Reranking-Schemas. Durch umfangreiche Experimente und quantitative Analyse der generierten Caption-Texte entwickeln wir EnCLAP++, eine verbesserte Version, die die ursprüngliche Variante erheblich übertrifft.