HyperAIHyperAI
منذ 17 أيام

NeurST: أداة الترجمة الصوتية العصبية

Chengqi Zhao, Mingxuan Wang, Qianqian Dong, Rong Ye, Lei Li
NeurST: أداة الترجمة الصوتية العصبية
الملخص

NeurST هو أداة مفتوحة المصدر للترجمة الصوتية العصبية. يركّز هذا الأداة بشكل رئيسي على الترجمة الصوتية من الطرف إلى الطرف (end-to-end)، وهي سهلة الاستخدام والتعديل والتوسيع لدعم الأبحاث المتقدمة في مجال الترجمة الصوتية والمنتجات المرتبطة بها. يهدف NeurST إلى تسهيل أبحاث الترجمة الصوتية للباحثين في مجال معالجة اللغة الطبيعية (NLP) وبناء معايير موثوقة لهذا المجال. ويقدّم الأداة وصفًا خطوة بخطوة لاستخراج الميزات، وتحضير البيانات، والتدريب الموزع، وتقييم النماذج. في هذه الورقة، سنقدّم تصميم الإطار العام لـ NeurST ونعرض نتائج تجريبية على مجموعات بيانات معيارية مختلفة، والتي يمكن اعتبارها قواعد مرجعية موثوقة للأبحاث المستقبلية. تُتاح الأداة للعامة عبر الرابط: https://github.com/bytedance/neurst/، وسنقوم بتحديث أدائها باستمرار مقارنةً بأدوات ودراسات أخرى عبر الموقع: https://st-benchmark.github.io/.