LSVTD-Datensatz Zum Verständnis Von Videotexten
Datum
vor 3 Jahren
Veröffentlichungs-URL
Lizenz
其他
Kategorien

LSVTD steht für Large-Scale Video Text Dataset und enthält 100 Videos aus 21 Naturszenen. Der Datensatz deckt ein breites Spektrum von 13 Innenszenen (z. B. Buchhandlungen, Einkaufszentren) und 9 Außenszenen ab und seine Vielfalt ist mehr als dreimal so groß wie die des IC15-Datensatzes.