VoxCeleb2 语音识别数据集

数据集下载 磁力链 下载帮助

VoxCeleb2 是一个源自开源媒体的大规模说话人 (Speaker) 识别数据集,由超过 6 千名说话者的一百万条语料组成。由于该数据集是在自然场景中收集的,因此语音片段中不乏笑声、交谈声、频道效果、音乐等干扰。

VoxCeleb2 中的语料是多语言的,说话者来自 145 个国家,涵盖了广泛的口音、年龄、种族和语种。同时该数据集包括音频和视频,也适用于解决可视语音合成 (visual speech synthesis)、语音分离 (speech separation)、face-voice 跨模态转换、视频人脸识别等问题。

数据集详情:

1 做种 0 下载 581 已完成
  • VoxCeleb2/README.md 1.41 KB
  • VoxCeleb2/README.txt 1.41 KB
  • VoxCeleb2/data/list_test_all.txt 34.38 MB
  • VoxCeleb2/data/list_test_all2.txt 34.28 MB
  • VoxCeleb2/data/list_test_hard.txt 32.67 MB
  • VoxCeleb2/data/list_test_hard2.txt 32.57 MB
  • VoxCeleb2/data/veri_test.txt 2.23 MB
  • VoxCeleb2/data/veri_test2.txt 2.22 MB
  • VoxCeleb2/data/vox2_dev_txt.zip 1.47 GB
  • VoxCeleb2/data/vox2_meta.csv 161.37 KB
  • VoxCeleb2/data/vox2_test_txt.zip 50.87 MB