HyperAI초신경

CAS-VSR-W1k 입술 읽기 인식 데이터 세트

날짜

3년 전

기관

발행 주소

vipl.ict.ac.cn

라이선스

非商业用途

카테고리

다운로드 도움말
特色图像

CAS-VSR-W1k는 이전에 LRW-1000으로 알려졌으며, 현재 공개된 가장 큰 중국어 어휘 수준 입술 읽기 데이터 세트입니다. 이 데이터 세트에는 1,000개의 단어 클래스가 포함되어 있으며 2,000명 이상의 화자로부터 얻은 700,000개의 샘플이 포함되어 있습니다. 이 데이터 세트에는 1,000,000개 이상의 중국어 문자 인스턴스가 포함되어 있습니다.

각 카테고리는 하나 이상의 중국어 문자로 구성된 중국어 단어의 음절에 해당합니다. 이 데이터 세트는 실제 응용 프로그램에서 발생하는 과제를 통합하기 위해 다양한 음성 양식과 영상 조건에서 나타나는 자연스러운 변화를 다루도록 설계되었습니다.