Command Palette
Search for a command to run...
إذا أخطأت، فأنت إنسان، لكن اللامات يمكنها أيضًا تعلّم ذلك
إذا أخطأت، فأنت إنسان، لكن اللامات يمكنها أيضًا تعلّم ذلك
Agnes Luhtaru Taido Purason Martin Vainikko Maksym Del Mark Fishel
الملخص
تستكشف هذه الدراسة تحسين تصحيح الأخطاء النحوية (GEC) من خلال توليد أخطاء اصطناعية باستخدام نماذج اللغة (LMs). بشكل خاص، نُعدّل نماذج لغة تعتمد على Llama 2 لتوليد الأخطاء، ونجد أن هذا النهج ينتج أخطاء اصطناعية تشبه الأخطاء البشرية. ثم نُدرّب نماذج GEC المبنية على Llama باستخدام هذه الأخطاء الاصطناعية، ونحقق أداءً أفضل من النماذج السابقة الأفضل في مجال التصحيح، مع تحسّن يتراوح بين 0.8 و6 نقاط في معيار F0.5 عبر جميع اللغات التي تم اختبارها (الألمانية، الأوكرانية، والإستونية). علاوةً على ذلك، نُظهر أن توليد الأخطاء من خلال تعديل نماذج تسلسلية أصغر حجمًا وتحفيز نماذج لغة تجارية كبيرة (مثل GPT-3.5 وGPT-4) يؤدي أيضًا إلى أخطاء اصطناعية تُسهم بشكل مفيد في تحسين نماذج توليد الأخطاء.