HyperAIHyperAI

Command Palette

Search for a command to run...

VoxPopuli: مجموعة بيانات صوتية متعددة اللغات على نطاق واسع لتعلم التمثيل، والتعلم شبه المراقب، والتأويل

Changhan Wang Morgane Rivière Ann Lee Anne Wu Chaitanya Talnikar Daniel Haziza Mary Williamson Juan Pino Emmanuel Dupoux

الملخص

نقدم "VoxPopuli"، وهو مجموعة بيانات كبيرة متعددة اللغات تُقدّم 100 ألف ساعة من بيانات الصوت غير المُعلَّمة بلغات 23 لغة. وهي أكبر مجموعة بيانات مفتوحة حتى الآن لتعلم التمثيل غير المُراقب وللتعلم شبه المُراقب. كما تحتوي "VoxPopuli" على 1.8 ألف ساعة من التسجيلات الصوتية المُحوَّلة إلى نصوص بلغات 16 لغة، بالإضافة إلى تفسيراتها الشفهية المُتماشية بلغات 5 لغات أخرى، بمجمل 5.1 ألف ساعة. نقدّم قواعد مرجعية للاعتراف بالصوت، ونختبر مرونة بيانات "VoxPopuli" غير المُعلَّمة في سياقات التعلم شبه المُراقب تحت ظروف صعبة خارج نطاق البيانات المستهدفة. وسوف نُطلق المجموعة على منصة GitHub عبر الرابط التالي: https://github.com/facebookresearch/voxpopuli، بترخيص مفتوح.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp