HyperAI
Command Palette
Search for a command to run...
LSVTD ビデオ テキスト理解データセット

LSVTD は大規模ビデオ テキスト データセットの略で、21 の自然シーンからの 100 個のビデオが含まれています。このデータセットは、13 の屋内 (書店、ショッピング モールなど) と 9 つの屋外シーンを幅広くカバーしており、その多様性は IC15 データセットの 3 倍以上です。
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。