VoxCeleb2 음성 인식 데이터 세트
VoxCeleb2는 오픈 소스 미디어에서 파생된 대규모 화자 인식 데이터 세트로, 6,000명 이상의 화자로부터 수집된 100만 개의 코퍼스로 구성되어 있습니다. 데이터 세트는 자연스러운 장면에서 수집되므로 음성 클립에서 웃음, 대화, 채널 효과, 음악 등의 간섭이 부족하지 않습니다.
VoxCeleb2의 코퍼스는 다국어로 구성되어 있으며, 145개국 출신의 화자가 다양한 억양, 연령, 민족, 언어를 사용하고 있습니다. 동시에 이 데이터 세트에는 오디오와 비디오가 포함되어 있으며, 시각적 음성 합성, 음성 분리, 얼굴-음성 교차 모달 변환, 비디오 얼굴 인식과 같은 문제를 해결하는 데에도 적합합니다.
데이터 세트 세부 정보:

VoxCeleb2.torrent
시딩 1다운로드 중 1완료됨 458총 다운로드 횟수 1,114