HyperAI超神経

LSVTD ビデオ テキスト理解データセット

日付

3年前

組織

浙江大学

ライセンス

其他

カテゴリ

ダウンロードヘルプ
特色图像

LSVTD は大規模ビデオ テキスト データセットの略で、21 の自然シーンからの 100 個のビデオが含まれています。このデータセットは、13 の屋内 (書店、ショッピング モールなど) と 9 つの屋外シーンを幅広くカバーしており、その多様性は IC15 データセットの 3 倍以上です。