مجموعة بيانات التعرف على قراءة الشفاه CAS-VSR-W1k
التاريخ
منذ 3 أعوام
رابط النشر
الترخيص
非商业用途
الفئات

CAS-VSR-W1k، المعروف سابقًا باسم LRW-1000، هو أكبر مجموعة بيانات متاحة للعامة لقراءة الشفاه على مستوى مفردات الماندرين. تحتوي مجموعة البيانات على 1000 فئة من الكلمات وتشمل 700000 عينة من أكثر من 2000 متحدث. تحتوي مجموعة البيانات على أكثر من مليون نسخة من الأحرف الصينية.
تتوافق كل فئة مع مقطع لفظي من كلمة ماندرينية تتكون من حرف صيني واحد أو أكثر. تم تصميم مجموعة البيانات لتغطية الاختلافات الطبيعية في طرق الكلام المختلفة وظروف التصوير لتشمل التحديات التي تواجهها التطبيقات في العالم الحقيقي.