MSR-VTTビデオ字幕データセット

MSR-VTT (Microsoft Research Video to Text の正式名) は、オープン ドメイン向けの大規模なビデオ字幕データ セットです。
データセットには 20 のカテゴリからの 10,000 のビデオクリップが含まれており、各ビデオクリップには Amazon Mechanical Turks によって注釈が付けられた 20 の英語の文が含まれています。すべての字幕には約 29,000 種類の単語が含まれています。標準セグメンテーションでは、トレーニングに 6,513 セグメント、検証に 497 セグメント、テストに 2,990 セグメントが使用されます。
MSR-VTT.torrent
シーディング 1ダウンロード中 1ダウンロード完了 783総ダウンロード数 1,814