HyperAIHyperAI

Command Palette

Search for a command to run...

التدريب المسبق للترجمة الآلية لعملية التوليد من البيانات إلى النص – دراسة حالة في اللغة التشيكية

Mihir Kale Scott Roy

الملخص

على الرغم من وجود كمية كبيرة من الأبحاث التي تدرس أساليب التعلم العميق لإنشاء النصوص من البيانات المنظمة، فإن معظمها يركز حصريًا على اللغة الإنجليزية. في هذه الورقة، نستعرض فعالية التدريب المسبق القائم على الترجمة الآلية لمهام إنشاء النصوص من البيانات في اللغات غير الإنجليزية. وبما أن البيانات المنظمة تُعبَّر عنها عادةً باللغة الإنجليزية، فإن إنشاء النصوص بلغات أخرى يتضمن عناصر الترجمة، والنقل الصوتي (التحوّل الصوتي)، والنسخ – عناصر مُشَكَّلة مسبقًا في أنظمة الترجمة الآلية العصبية. علاوةً على ذلك، وبما أن مجموعات البيانات المُنشأة للنصوص غالبًا ما تكون صغيرة، فإن هذه المهمة تستفيد بشكل كبير من التدريب المسبق. استنادًا إلى تجاربنا على اللغة التشيكية، وهي لغة ذات تركيب نحوى معقد، نجد أن التدريب المسبق يمكّننا من تدريب نماذج تعمل من البداية إلى النهاية بتحسن ملحوظ في الأداء، حسب معايير تقييم آلية وتقييم بشري. كما نُظهر أن هذا النهج يتمتع بعدة خصائص مرغوبة، منها تحسين الأداء في السيناريوهات التي تفتقر إلى كميات كبيرة من البيانات، ومتانة الأداء تجاه قيم الحقول (السلاطات) غير المُدرَكة مسبقًا.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp