HyperAI

مجموعة بيانات التعرف على قراءة الشفاه CAS-VSR-W1k

التاريخ

منذ 3 أعوام

المؤسسة

رابط النشر

vipl.ict.ac.cn

الترخيص

非商业用途

مساعدة التنزيل
特色图像

CAS-VSR-W1k، المعروف سابقًا باسم LRW-1000، هو أكبر مجموعة بيانات متاحة للعامة لقراءة الشفاه على مستوى مفردات الماندرين. تحتوي مجموعة البيانات على 1000 فئة من الكلمات وتشمل 700000 عينة من أكثر من 2000 متحدث. تحتوي مجموعة البيانات على أكثر من مليون نسخة من الأحرف الصينية.

تتوافق كل فئة مع مقطع لفظي من كلمة ماندرينية تتكون من حرف صيني واحد أو أكثر. تم تصميم مجموعة البيانات لتغطية الاختلافات الطبيعية في طرق الكلام المختلفة وظروف التصوير لتشمل التحديات التي تواجهها التطبيقات في العالم الحقيقي.