HyperAIHyperAI
منذ 17 أيام

Scribosermo: نماذج تحويل الصوت إلى نص سريعة للغة الألمانية واللغات الأخرى

Daniel Bermuth, Alexander Poeppel, Wolfgang Reif
Scribosermo: نماذج تحويل الصوت إلى نص سريعة للغة الألمانية واللغات الأخرى
الملخص

تتطلب نماذج التحويل الصوتي إلى نص الحديثة عادةً كميات كبيرة من المواردhardware، وغالبًا ما تُدرَّس باللغة الإنجليزية. تقدّم هذه الورقة نماذج للتحويل الصوتي إلى نص باللغة الألمانية، وكذلك باللغتين الإسبانية والفرنسية، وبخصائص خاصة: (أ) إنها صغيرة الحجم، وتعمل في الوقت الفعلي على وحدات التحكم الصغيرة مثل راسبيري باي. (ب) باستخدام نموذج إنجليزي مُدرّب مسبقًا، يمكن تدريبها على معدات استهلاكية باستخدام مجموعة بيانات صغيرة نسبيًا. (ج) تُعدّ هذه النماذج منافسةً لحلول أخرى، وتتفوّق عليها في اللغة الألمانية. وبهذا المعنى، تجمع النماذج بين مزايا الطرق الأخرى، التي تشمل فقط مجموعة جزئية من الميزات المقدمة هنا. علاوةً على ذلك، تقدّم الورقة مكتبة جديدة لإدارة المجموعات البيانات، والتي تتمحور حول إمكانية التوسعة السهلة بإضافة مجموعات بيانات إضافية، وتُظهر طريقة مُحسَّنة لنقل التعلّم (transfer-learning) إلى لغات جديدة باستخدام نموذج مُدرّب مسبقًا من لغة أخرى ذات أبجدية مشابهة.