HyperAI
Command Palette
Search for a command to run...
AVSpeech – オーディオビジュアル音声データセット
AVSpeech は、気を散らす背景ノイズのない音声ビデオ クリップで構成される新しい大規模な視聴覚データセットです。クリップの長さは 3 ~ 10 秒で、各クリップのサウンドトラックで聞こえる声は、ビデオに表示されている唯一の人物が話しているものです。
このデータセットには、さまざまな人物、言語、顔のポーズをカバーする 290,000 本の YouTube ビデオからの約 4,700 時間のビデオ クリップが含まれています。
AVSpeech.torrent
シーディング 2ダウンロード中 3完了 2,848総ダウンロード数 4,465
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。