HyperAIHyperAI

Command Palette

Search for a command to run...

إطار متمحور حول البيانات لمعالجة التحديات الصوتية والتنغيمية في نماذج الكلام التوليدية الروسية

Kirill Borodin Nikita Vasiliev Vasiliy Kudryavtsev Maxim Maslov Mikhail Gorodnichev Oleg Rogov Grach Mkrtchian

الملخص

تُقدِّم التركيب الصوتي للغة الروسية تحديات مميزة، تشمل تقليل الحركات، إسقاط الصوت للحروف الساكنة، أنماط الضرب المتغيرة، الغموض في الكلمات المكتوبة بنفس الطريقة ولكن بمعانٍ مختلفة (الكلمات المتشابهة اللفظ)، والتنغيم غير الطبيعي. يُعرِّف هذا البحث مجموعة بيانات جديدة تُسمى "بالالايكا"، والتي تتضمن أكثر من 2,000 ساعة من الكلام الروسي ذي الجودة الاستوديو مع شروح نصية شاملة، بما في ذلك علامات الترقيم وعلامات الضرب. تُظهر النتائج التجريبية أن النماذج التي تم تدريبها على "بالالايكا" تتفوق بشكل كبير على تلك التي تم تدريبها على مجموعات البيانات الموجودة حالياً في كل من مهمتي التركيب الصوتي وتحسين الكلام. نفصل خطوات بناء مجموعة البيانات، منهجية الشروح، ونتائج التقييمات المقارنة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp