HyperAI

LSVTD-Datensatz Zum Verständnis Von Videotexten

Datum

vor 3 Jahren

Organisation

Zhejiang-Universität

Veröffentlichungs-URL

davar-lab.github.io

Lizenz

其他

Kategorien

Download-Hilfe
特色图像

LSVTD steht für Large-Scale Video Text Dataset und enthält 100 Videos aus 21 Naturszenen. Der Datensatz deckt ein breites Spektrum von 13 Innenszenen (z. B. Buchhandlungen, Einkaufszentren) und 9 Außenszenen ab und seine Vielfalt ist mehr als dreimal so groß wie die des IC15-Datensatzes.