HyperAIHyperAI

Command Palette

Search for a command to run...

CAS-VSR-W1k 입술 읽기 인식 데이터 세트

Discord에서 논의하기

날짜

4년 전

조직

게시 URL

vipl.ict.ac.cn

Paper URL

arxiv.org

라이선스

Non-Commercial

Featured Image

CAS-VSR-W1k는 이전에 LRW-1000으로 알려졌으며, 현재 공개된 가장 큰 중국어 어휘 수준 입술 읽기 데이터 세트입니다. 이 데이터 세트에는 1,000개의 단어 클래스가 포함되어 있으며 2,000명 이상의 화자로부터 얻은 700,000개의 샘플이 포함되어 있습니다. 이 데이터 세트에는 1,000,000개 이상의 중국어 문자 인스턴스가 포함되어 있습니다. 각 카테고리는 하나 이상의 중국어 문자로 구성된 중국어 단어의 음절에 해당합니다. 이 데이터 세트는 실제 응용 프로그램에서 발생하는 과제를 통합하기 위해 다양한 음성 양식과 영상 조건에서 나타나는 자연스러운 변화를 다루도록 설계되었습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp