تقدير الجودة العصبية مع فرضيات متعددة لتصحيح الأخطاء النحوية

تصحيح الأخطاء النحوية (GEC) يهدف إلى تصحيح أخطاء الكتابة ومساعدة متعلمي اللغة على تحسين مهاراتهم في الكتابة. ومع ذلك، فإن النماذج الحالية لتصحيح الأخطاء النحوية تميل إلى إجراء تصحيحات غير صحيحة أو فشل في اكتشاف الكثير من الأخطاء. يعتبر نموذج تقدير الجودة ضروريًا لضمان حصول المتعلمين على نتائج دقيقة لتصحيح الأخطاء النحوية وتجنب التضليل من الجمل المصححة بشكل سيء. يمكن للنماذج المدربة جيدًا أن تولد العديد من الفرضيات ذات الجودة العالية من خلال عملية التفكيش، مثل البحث الشعاعي (beam search)، مما يوفر أدلة قيمة لتصحيح الأخطاء النحوية ويمكن استخدامها لتقييم جودة تصحيح الأخطاء النحوية. ومع ذلك، فإن النماذج الحالية تتجاهل الأدلة المحتملة لتصحيح الأخطاء النحوية من الفرضيات المختلفة. يقدم هذا البحث شبكة التحقق العصبية (VERNet) لتقييم جودة تصحيح الأخطاء النحوية باستخدام عدة فرضيات. تقوم VERNet بتأسيس تفاعلات بين الفرضيات باستخدام رسم بياني للمنطق (reasoning graph) وتقوم بتنفيذ نوعين من آليات الانتباه لنشر أدلة تصحيح الأخطاء النحوية والتحقق من جودة الفرضيات المولدة. أظهرت تجاربنا على أربع قواعد بيانات لتصحيح الأخطاء النحوية أن VERNet حققت أفضل أداء في اكتشاف الأخطاء النحوية وأفضل نتائج في تقدير الجودة، وأنها تحسنت بشكل كبير من أداء تصحيح الأخطاء النحوية عن طريق إعادة تصنيف الفرضيات. جميع البيانات والأكواد المصدر متاحة على الرابط: https://github.com/thunlp/VERNet.