منذ 11 أيام
تحسين تصحيح الأخطاء النحوية من خلال تصنيف التصحيحات الأولية
{Anonymous}

الملخص
نقدّم طريقة إعادة تقييم لتصحيح الأخطاء النحوية تعتمد على إجراء مزدوج: حيث يستخرج النموذج في المرحلة الأولى التصحيحات المحلية، ثم تصنف هذه التصحيحات في المرحلة الثانية على أنها صحيحة أو خاطئة. ونوضح كيفية استخدام نهج المُشفّر-المنشئ (encoder-decoder) أو نهج تسمية التسلسل (sequence labeling) كمرحلة أولى في نموذجنا. ونحقق جودة متقدمة على مجموعة بيانات BEA 2019 الإنجليزية، حتى باستخدام نموذج أساسي ضعيف (BERT-GEC). وباستخدام مُولِّد التصحيحات GECToR المتطور حديثًا مع المُقيّم المدمج، يتفوّق نموذجنا على GECToR بنسبة 2–3% على مجموعة بيانات BEA 2019. كما يتفوّق نموذجنا على أحدث النماذج السابقة في اللغة الروسية، رغم استخدامه نماذج أصغر وأقل بيانات مقارنة بالحلول السابقة.