How2 多言語ビデオ データセット

下载帮助
特色图像

これは、13,500 のビデオ、300 時間の音声を含む多言語ビデオ データセットで、英語の字幕とポルトガル語の翻訳が付いています。そのうち、185,187 コーパスがトレーニングに使用され、2,022 コーパスが開発 (dev) に使用され、2,361 コーパスがテストに使用されます。このデータセットは、マルチモーダルな言語理解を研究するために使用できます。