الملخص

نقدم "VoxPopuli"، وهو مجموعة بيانات كبيرة متعددة اللغات تُقدّم 100 ألف ساعة من بيانات الصوت غير المُعلَّمة بلغات 23 لغة. وهي أكبر مجموعة بيانات مفتوحة حتى الآن لتعلم التمثيل غير المُراقب وللتعلم شبه المُراقب. كما تحتوي "VoxPopuli" على 1.8 ألف ساعة من التسجيلات الصوتية المُحوَّلة إلى نصوص بلغات 16 لغة، بالإضافة إلى تفسيراتها الشفهية المُتماشية بلغات 5 لغات أخرى، بمجمل 5.1 ألف ساعة. نقدّم قواعد مرجعية للاعتراف بالصوت، ونختبر مرونة بيانات "VoxPopuli" غير المُعلَّمة في سياقات التعلم شبه المُراقب تحت ظروف صعبة خارج نطاق البيانات المستهدفة. وسوف نُطلق المجموعة على منصة GitHub عبر الرابط التالي: https://github.com/facebookresearch/voxpopuli، بترخيص مفتوح.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

HyperAI

منذ 6 أشهر

مجموعة بيانات

المعالجة الصوتية والصوتية

Text-to-Speech

بنية ذكاء اصطناعي الأساسية

صوتيات

مهمة

Changhan Wang Morgane Rivière Ann Lee Anne Wu Chaitanya Talnikar Daniel Haziza Mary Williamson Juan Pino Emmanuel Dupoux

الملخص

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

VoxPopuli: مجموعة بيانات صوتية متعددة اللغات على نطاق واسع لتعلم التمثيل، والتعلم شبه المراقب، والتأويل

Changhan Wang Morgane Rivière Ann Lee Anne Wu Chaitanya Talnikar Daniel Haziza Mary Williamson Juan Pino Emmanuel Dupoux

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

VoxPopuli: مجموعة بيانات صوتية متعددة اللغات على نطاق واسع لتعلم التمثيل، والتعلم شبه المراقب، والتأويل

Changhan Wang Morgane Rivière Ann Lee Anne Wu Chaitanya Talnikar Daniel Haziza Mary Williamson Juan Pino Emmanuel Dupoux

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

VoxPopuli: مجموعة بيانات صوتية متعددة اللغات على نطاق واسع لتعلم التمثيل، والتعلم شبه المراقب، والتأويل

Changhan Wang Morgane Rivière Ann Lee Anne Wu Chaitanya Talnikar Daniel Haziza Mary Williamson Juan Pino Emmanuel Dupoux

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters