HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات التعرف على قراءة الشفاه CAS-VSR-W1k

ناقش على Discord

التاريخ

منذ 3 أعوام

المؤسسة

عنوان URL للنشر

vipl.ict.ac.cn

رابط الورقة البحثية

arxiv.org

الترخيص

Non-Commercial

Featured Image

CAS-VSR-W1k، المعروف سابقًا باسم LRW-1000، هو أكبر مجموعة بيانات متاحة للعامة لقراءة الشفاه على مستوى مفردات الماندرين. تحتوي مجموعة البيانات على 1000 فئة من الكلمات وتشمل 700000 عينة من أكثر من 2000 متحدث. تحتوي مجموعة البيانات على أكثر من مليون نسخة من الأحرف الصينية.

تتوافق كل فئة مع مقطع لفظي من كلمة ماندرينية تتكون من حرف صيني واحد أو أكثر. تم تصميم مجموعة البيانات لتغطية الاختلافات الطبيعية في طرق الكلام المختلفة وظروف التصوير لتشمل التحديات التي تواجهها التطبيقات في العالم الحقيقي.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp