HyperAIHyperAI

Command Palette

Search for a command to run...

دراسة مقارنة للنماذج المدربة على بيانات مُصَنَّعة لتصحيح الأخطاء النحوية في اللغة الأوكرانية

Andrii Fedorych Andrii Shportko Artem Yushko Maksym Bondarenko

الملخص

تم دراسة مهمة تصحيح الأخطاء النحوية (GEC) بشكل واسع للغة الإنجليزية. ومع ذلك، تظل تطبيقاتها على اللغات ذات الموارد المحدودة، مثل اللغة الأوكرانية، تحديًا مفتوحًا. في هذا البحث، نطور نماذج تصنيف التسلسل ونماذج الترجمة الآلية العصبية للغة الأوكرانية، بالإضافة إلى مجموعة من قواعد التصحيح الخوارزمية لتعزيز هذه الأنظمة. كما نطور تقنيات لإنشاء بيانات اصطناعية للغة الأوكرانية لإنتاج أخطاء ذات جودة عالية تشبه الأخطاء البشرية. وأخيرًا، نحدد أفضل تركيبة من البيانات المولدة اصطناعيًا لتعزيز مجموعة بيانات UA-GEC الحالية، مما يُحقق نتائج رائدة في المجال بتحصيل درجة F0.5 تبلغ 0.663 على معيار UA-GEC الجديد الذي تم إنشاؤه حديثًا. سيتم إتاحة الكود والنماذج المدربة للجمهور عبر منصتي GitHub وHuggingFace.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp