HyperAIHyperAI

Command Palette

Search for a command to run...

Console

مجموعة بيانات التعرف على قراءة الشفاه CAS-VSR-W1k

التاريخ

منذ 3 أعوام

المؤسسة

رابط النشر

vipl.ict.ac.cn

رابط الورقة البحثية

arxiv.org

الترخيص

غير تجاري

انضم إلى مجتمع Discord
Featured Image

CAS-VSR-W1k، المعروف سابقًا باسم LRW-1000، هو أكبر مجموعة بيانات متاحة للعامة لقراءة الشفاه على مستوى مفردات الماندرين. تحتوي مجموعة البيانات على 1000 فئة من الكلمات وتشمل 700000 عينة من أكثر من 2000 متحدث. تحتوي مجموعة البيانات على أكثر من مليون نسخة من الأحرف الصينية.

تتوافق كل فئة مع مقطع لفظي من كلمة ماندرينية تتكون من حرف صيني واحد أو أكثر. تم تصميم مجموعة البيانات لتغطية الاختلافات الطبيعية في طرق الكلام المختلفة وظروف التصوير لتشمل التحديات التي تواجهها التطبيقات في العالم الحقيقي.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp