Command Palette
Search for a command to run...
AVSpeech – 视听语音数据集
AVSpeech 是一个新的、大规模的视听数据集,包括没有干扰的背景噪音的语音视频片段。这些片段的长度为 3-10 秒,在每个片段中,原声带中的听到的声音,属于视频中可看见的唯一在说话的人。
该数据集包含大约 4700 小时的视频片段,来自 29 万个 YouTube 视频,涵盖了各种各样的人、语言和面部姿势。
AVSpeech.torrent
Seeding 3Downloading 2Completed 2,838Total Downloads 4,370
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.
AI Co-coding
Ready-to-use GPUs
Best Pricing
HyperAI Newsletters
订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供