شبكة عصبية متعددة الطبقات لتصحيح الأخطاء النحوية باستخدام مُشفِّر ومُفكِّك التوافقي

نحسن تصحيح الأخطاء النحوية والترقيم والتراكيب في النص باستخدام شبكة عصبية متعددة الطبقات من نوع المُشفِّر-المُفكِّك المُلتف (Convolutional Encoder-Decoder Neural Network). يتم تهيئة الشبكة بتمثيلات (Embeddings) تستفيد من معلومات نماذج N-gram على مستوى الحروف لتناسب هذه المهمة بشكل أفضل. عند تقييمها على مجموعات بيانات الاختبار القياسية (CoNLL-2014 و JFLEG)، يتفوق نموذجنا بشكل كبير على جميع النماذج العصبية السابقة وعلى أنظمة الترجمة الآلية الإحصائية القوية التي تم تدريبها على البيانات نفسها مع خصائص عصبية ومحددة للمهمة. تظهر تحليلاتنا تفوق شبكات العصب المتلافقة (Convolutional Neural Networks) على شبكات العصب المتكررة مثل شبكات الذاكرة قصيرة المدى طويلة الأمد (LSTM) في التقاط السياق المحلي عبر آلية الانتباه، مما يعزز تغطية تصحيح الأخطاء النحوية. من خلال الجمع بين عدة نماذج ودمج نموذج لغوي N-gram وخواص التعديل عبر إعادة التقييم، يصبح أسلوبنا الجديد أول نهج عصبي يتفوق على أحدث الأساليب المستندة إلى الترجمة الآلية الإحصائية، سواءً من حيث الصحة النحوية أو السلاسة التعبيرية.