تحسين تصحيح الأخطاء النحوية من خلال تصنيف التصحيحات الأولية
{Anonymous}

الملخص
نقدّم طريقة إعادة تقييم لتصحيح الأخطاء النحوية تعتمد على إجراء مزدوج: حيث يستخرج النموذج في المرحلة الأولى التصحيحات المحلية، ثم تصنف هذه التصحيحات في المرحلة الثانية على أنها صحيحة أو خاطئة. ونوضح كيفية استخدام نهج المُشفّر-المنشئ (encoder-decoder) أو نهج تسمية التسلسل (sequence labeling) كمرحلة أولى في نموذجنا. ونحقق جودة متقدمة على مجموعة بيانات BEA 2019 الإنجليزية، حتى باستخدام نموذج أساسي ضعيف (BERT-GEC). وباستخدام مُولِّد التصحيحات GECToR المتطور حديثًا مع المُقيّم المدمج، يتفوّق نموذجنا على GECToR بنسبة 2–3% على مجموعة بيانات BEA 2019. كما يتفوّق نموذجنا على أحدث النماذج السابقة في اللغة الروسية، رغم استخدامه نماذج أصغر وأقل بيانات مقارنة بالحلول السابقة.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| grammatical-error-correction-on-bea-2019-test | clang_large_ft2-gector | F0.5: 77.1 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.