HyperAI초신경

LSVTD 비디오 텍스트 이해 데이터 세트

날짜

3년 전

기관

저장대학교

발행 주소

davar-lab.github.io

라이선스

其他

카테고리

다운로드 도움말
特色图像

LSVTD는 대규모 비디오 텍스트 데이터 세트를 의미하며, 21개의 자연경관에서 촬영한 100개의 비디오가 포함되어 있습니다. 이 데이터 세트는 13개의 실내(서점, 쇼핑몰 등)와 9개의 실외 장면을 광범위하게 포괄하고 있으며, 그 다양성은 IC15 데이터 세트보다 3배 이상 높습니다.