Command Palette

Search for a command to run...

VoxCeleb2 음성 인식 데이터 세트

날짜

3년 전

크기

1.65 GB

기관

옥스퍼드 대학교

발행 주소

www.robots.ox.ac.uk

논문 URL

arxiv.org

라이선스

CC BY 4.0

VoxCeleb2는 오픈 소스 미디어에서 파생된 대규모 화자 인식 데이터 세트로, 6,000명 이상의 화자로부터 수집된 100만 개의 코퍼스로 구성되어 있습니다. 데이터 세트는 자연스러운 장면에서 수집되므로 음성 클립에서 웃음, 대화, 채널 효과, 음악 등의 간섭이 부족하지 않습니다.

VoxCeleb2의 코퍼스는 다국어로 구성되어 있으며, 145개국 출신의 화자가 다양한 억양, 연령, 민족, 언어를 사용하고 있습니다. 동시에 이 데이터 세트에는 오디오와 비디오가 포함되어 있으며, 시각적 음성 합성, 음성 분리, 얼굴-음성 교차 모달 변환, 비디오 얼굴 인식과 같은 문제를 해결하는 데에도 적합합니다.

데이터 세트 세부 정보:

VoxCeleb2.torrent
시딩 2다운로드 중 0완료됨 590총 다운로드 횟수 1,356
  • VoxCeleb2/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • list_test_all.txt
          34.38 MB
        • list_test_all2.txt
          68.67 MB
        • list_test_hard.txt
          101.34 MB
        • list_test_hard2.txt
          133.91 MB
        • veri_test.txt
          136.14 MB
        • veri_test2.txt
          138.37 MB
        • vox2_dev_txt.zip
          1.6 GB
        • vox2_meta.csv
          1.6 GB
        • vox2_test_txt.zip
          1.65 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp