Command Palette
Search for a command to run...
AVSpeech – オーディオビジュアル音声データセット
AVSpeech は、気を散らす背景ノイズのない音声ビデオ クリップで構成される新しい大規模な視聴覚データセットです。クリップの長さは 3 ~ 10 秒で、各クリップのサウンドトラックで聞こえる声は、ビデオに表示されている唯一の人物が話しているものです。
このデータセットには、さまざまな人物、言語、顔のポーズをカバーする 290,000 本の YouTube ビデオからの約 4,700 時間のビデオ クリップが含まれています。
AVSpeech.torrent
シーディング 3ダウンロード中 0ダウンロード完了 2,819総ダウンロード数 4,253