منذ 6 أشهر

الملخص

تستكشف هذه الدراسة تحسين تصحيح الأخطاء النحوية (GEC) من خلال توليد أخطاء اصطناعية باستخدام نماذج اللغة (LMs). بشكل خاص، نُعدّل نماذج لغة تعتمد على Llama 2 لتوليد الأخطاء، ونجد أن هذا النهج ينتج أخطاء اصطناعية تشبه الأخطاء البشرية. ثم نُدرّب نماذج GEC المبنية على Llama باستخدام هذه الأخطاء الاصطناعية، ونحقق أداءً أفضل من النماذج السابقة الأفضل في مجال التصحيح، مع تحسّن يتراوح بين 0.8 و6 نقاط في معيار F0.5 عبر جميع اللغات التي تم اختبارها (الألمانية، الأوكرانية، والإستونية). علاوةً على ذلك، نُظهر أن توليد الأخطاء من خلال تعديل نماذج تسلسلية أصغر حجمًا وتحفيز نماذج لغة تجارية كبيرة (مثل GPT-3.5 وGPT-4) يؤدي أيضًا إلى أخطاء اصطناعية تُسهم بشكل مفيد في تحسين نماذج توليد الأخطاء.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار