HyperAIHyperAI
منذ 16 أيام

إذا أخطأت، فأنت إنسان، لكن اللامات يمكنها أيضًا تعلّم ذلك

Agnes Luhtaru, Taido Purason, Martin Vainikko, Maksym Del, Mark Fishel
إذا أخطأت، فأنت إنسان، لكن اللامات يمكنها أيضًا تعلّم ذلك
الملخص

تستكشف هذه الدراسة تحسين تصحيح الأخطاء النحوية (GEC) من خلال توليد أخطاء اصطناعية باستخدام نماذج اللغة (LMs). بشكل خاص، نُعدّل نماذج لغة تعتمد على Llama 2 لتوليد الأخطاء، ونجد أن هذا النهج ينتج أخطاء اصطناعية تشبه الأخطاء البشرية. ثم نُدرّب نماذج GEC المبنية على Llama باستخدام هذه الأخطاء الاصطناعية، ونحقق أداءً أفضل من النماذج السابقة الأفضل في مجال التصحيح، مع تحسّن يتراوح بين 0.8 و6 نقاط في معيار F0.5 عبر جميع اللغات التي تم اختبارها (الألمانية، الأوكرانية، والإستونية). علاوةً على ذلك، نُظهر أن توليد الأخطاء من خلال تعديل نماذج تسلسلية أصغر حجمًا وتحفيز نماذج لغة تجارية كبيرة (مثل GPT-3.5 وGPT-4) يؤدي أيضًا إلى أخطاء اصطناعية تُسهم بشكل مفيد في تحسين نماذج توليد الأخطاء.

إذا أخطأت، فأنت إنسان، لكن اللامات يمكنها أيضًا تعلّم ذلك | أحدث الأوراق البحثية | HyperAI