HyperAIHyperAI
منذ 16 أيام

تصحيح الأخطاء النحوية غير المراقب الذي يتنافس مع الطرق المراقبة

{Hwee Tou Ng, Yuchen Zhang, Liping Yuan, Hannan Cao}
تصحيح الأخطاء النحوية غير المراقب الذي يتنافس مع الطرق المراقبة
الملخص

تُعتمد أنظمة تصحيح الأخطاء النحوية الحديثة (GEC) على بيانات تدريب متزامنة (جمل غير صحيحة نحويًا ونسخ مصححة يدويًا منها)، والتي يُعد بناؤها مكلفًا جدًا. في هذا البحث، نستخدم منهجية "كسر-تصحيح-إعادة التصحيح" (BIFI) لبناء نظام GEC غير مراقب. يُنشئ إطار العمل BIFI بيانات متزامنة من نصوص غير مُعلَّمة باستخدام "محرر" لتحويل الجمل غير الصحيحة نحويًا إلى جمل صحيحة، و"مُقيّم" لتنبؤ صحة الجملة نحويًا. نقدم منهجية غير مراقبة لبناء المُحرر والمُقيّم، ونُقدّم خوارزمية تسمح لهما بالتحسين التدريجي المتبادل. قُمنا بتقييم نظام GEC غير المراقب لدينا على مهام تصحيح الأخطاء النحوية باللغة الإنجليزية والصينية. أظهرت النتائج التجريبية أن نظامنا يتفوّق على الأنظمة السابقة غير المراقبة، ويحقق أداءً مماثلًا للأنظمة المراقبة دون الحاجة إلى تجميع النماذج (ensemble). علاوةً على ذلك، عند دمج النظام مع بيانات تدريب مُعلَّمة، يحقق النظام نتائج جديدة تُعدّ الأفضل على الإطلاق (state-of-the-art) على مجموعتي الاختبار CoNLL-2014 وNLPCC-2018.

تصحيح الأخطاء النحوية غير المراقب الذي يتنافس مع الطرق المراقبة | أحدث الأوراق البحثية | HyperAI