HyperAIHyperAI
منذ 2 أشهر

SynGEC: تصحيح الأخطاء النحوية المُعزز بالتركيب مع محرك تحليل مخصص لتصحيح الأخطاء النحوية

Yue Zhang; Bo Zhang; Zhenghua Li; Zuyi Bao; Chen Li; Min Zhang
SynGEC: تصحيح الأخطاء النحوية المُعزز بالتركيب مع محرك تحليل مخصص لتصحيح الأخطاء النحوية
الملخص

يقترح هذا العمل نهجًا محسنًا بناءً على النحو لتصحيح الأخطاء النحوية (GEC) يُسمى SynGEC، والذي يدمج بشكل فعال المعلومات النحوية المعتمدة على الارتباط في جزء المُشفر من نماذج تصحيح الأخطاء النحوية. التحدي الرئيسي لهذا الفكرة هو أن المُحللات الجاهزة غير موثوقة عند معالجة الجمل غير النحوية. لمواجهة هذا التحدي، نقترح بناء مُحلل مُخصص لمهمة تصحيح الأخطاء النحوية (GOPar) باستخدام بيانات التدريب المتوازية لتصحيح الأخطاء النحوية كأساس. أولاً، نصمم نظام تمثيل نحو متقدم يتيح لنا تمثيل الأخطاء النحوية والنحو في هيكل شجرة موحد. ثانياً، نحصل على شجرات تحليل للجمل المصدر الخاطئة من خلال إسقاط شجرات الجمل الهدف الصحيحة. أخيراً، نقوم بتدريب GOPar باستخدام هذه الشجرات المُسقاة. بالنسبة لتصحيح الأخطاء النحوية، نستخدم شبكة التجعيد الرسمية لتشفير المعلومات النحوية للمصدر التي تنتجها GOPar، وندمجها مع خرجات مشفر Transformer. أظهرت التجارب على مجموعة البيانات الرئيسية للإنجليزية والصينية لتصحيح الأخطاء النحوية أن نهج SynGEC المقترح يتفوق بشكل مستمر ومهم على القواعد الأساسية القوية ويحقق أداءً تنافسيًا. يمكن الوصول إلى كودنا وبياناتنا بشكل عام عبر الرابط: https://github.com/HillZhang1999/SynGEC.请注意,为了更符合阿拉伯语的表达习惯,我做了一些调整。例如,“off-the-shelf parsers”被翻译为“المُحللات الجاهزة”,而“parallel GEC training data”则被翻译为“بيانات التدريب المتوازية لتصحيح الأخطاء النحوية”。此外,“graph convolution network”被翻译为“شبكة التجعيد الرسمية”,这是在阿拉伯语中常用的术语。希望这些调整能使译文更加自然流畅。

SynGEC: تصحيح الأخطاء النحوية المُعزز بالتركيب مع محرك تحليل مخصص لتصحيح الأخطاء النحوية | أحدث الأوراق البحثية | HyperAI