HyperAIHyperAI

Command Palette

Search for a command to run...

VoxCeleb2 음성 인식 데이터 세트

날짜

4년 전

크기

1.65 GB

조직

Paper URL

arxiv.org

라이선스

CC BY 4.0

VoxCeleb2는 오픈 소스 미디어에서 파생된 대규모 화자 인식 데이터 세트로, 6,000명 이상의 화자로부터 수집된 100만 개의 코퍼스로 구성되어 있습니다. 데이터 세트는 자연스러운 장면에서 수집되므로 음성 클립에서 웃음, 대화, 채널 효과, 음악 등의 간섭이 부족하지 않습니다. VoxCeleb2의 코퍼스는 다국어로 구성되어 있으며, 145개국 출신의 화자가 다양한 억양, 연령, 민족, 언어를 사용하고 있습니다. 동시에 이 데이터 세트에는 오디오와 비디오가 포함되어 있으며, 시각적 음성 합성, 음성 분리, 얼굴-음성 교차 모달 변환, 비디오 얼굴 인식과 같은 문제를 해결하는 데에도 적합합니다. 데이터 세트 세부 정보:

VoxCeleb2.torrent
시딩 2다운로드 중 0완료됨 651총 다운로드 수 1,474
  • VoxCeleb2/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • veri_test.txt
          136.14 MB
        • vox2_meta.csv
          1.6 GB
        • veri_test2.txt
          138.37 MB
        • vox2_dev_txt.zip
          1.6 GB
        • list_test_all.txt
          34.38 MB
        • vox2_test_txt.zip
          1.65 GB
        • list_test_all2.txt
          68.67 MB
        • list_test_hard.txt
          101.34 MB
        • list_test_hard2.txt
          133.91 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
VoxCeleb2 음성 인식 데이터 세트 | 데이터 세트 | HyperAI초신경