AVSD Audiovisueller Szenen-Dialogdatensatz
Datum
vor 3 Jahren
Veröffentlichungs-URL
Kategorien

AVSD, die Abkürzung für The Audio Visual Scene-Aware Dialog (oder DSTC7 Track 3), ist ein audiovisueller Datensatz zum Verstehen von Gesprächen. Der Datensatz zielt darauf ab, ein System aufzubauen und Antworten auf Dialoge in Eingabevideos zu generieren.