منذ 11 أيام
إطار متمحور حول البيانات لمعالجة التحديات الصوتية والتنغيمية في نماذج الكلام التوليدية الروسية
Kirill Borodin, Nikita Vasiliev, Vasiliy Kudryavtsev, Maxim Maslov, Mikhail Gorodnichev, Oleg Rogov, Grach Mkrtchian

الملخص
تُقدِّم التركيب الصوتي للغة الروسية تحديات مميزة، تشمل تقليل الحركات، إسقاط الصوت للحروف الساكنة، أنماط الضرب المتغيرة، الغموض في الكلمات المكتوبة بنفس الطريقة ولكن بمعانٍ مختلفة (الكلمات المتشابهة اللفظ)، والتنغيم غير الطبيعي. يُعرِّف هذا البحث مجموعة بيانات جديدة تُسمى "بالالايكا"، والتي تتضمن أكثر من 2,000 ساعة من الكلام الروسي ذي الجودة الاستوديو مع شروح نصية شاملة، بما في ذلك علامات الترقيم وعلامات الضرب. تُظهر النتائج التجريبية أن النماذج التي تم تدريبها على "بالالايكا" تتفوق بشكل كبير على تلك التي تم تدريبها على مجموعات البيانات الموجودة حالياً في كل من مهمتي التركيب الصوتي وتحسين الكلام. نفصل خطوات بناء مجموعة البيانات، منهجية الشروح، ونتائج التقييمات المقارنة.