تحليل تراكيب تراكمي قوي باستخدام شبكات عصبية رسمية

يمكن أن يُفيد تحليل الجمل إلى أشجار تركيبية التطبيقات التالية في معالجة اللغة الطبيعية. تقوم المُحلّلات القائمة على الانتقال ببناء الأشجار من خلال تنفيذ إجراءات ضمن نظام انتقال حالة. وهي فعّالة من حيث الحوسبة، ويمكنها الاستفادة من التعلم الآلي للتنبؤ بالإجراءات بناءً على أشجار جزئية. ومع ذلك، فإن المُحلّلات القائمة على الانتقال الحالية تعتمد بشكل رئيسي على نظام الانتقال "التحريك-الاستخلاص" (shift-reduce)، والذي لا يتماشى مع الطريقة التي يُعرف أن البشر يستخدمونها في تحليل الجمل. تشير الأبحاث النفسية اللغوية إلى أن تحليل البشر للجمل يكون قويًا في التقدم التدريجي: حيث يُبنى شجرة تحليل واحدة من خلال إضافة عنصر واحد فقط في كل خطوة. في هذه الورقة، نقترح نظام انتقال جديد يُسمى "الربط-المجاورة" (attach-juxtapose). يتميز هذا النظام بالتقدم التدريجي القوي؛ فهو يُمثّل الجملة الجزئية باستخدام شجرة واحدة فقط؛ وكل إجراء يضيف عنصرًا واحدًا بالضبط إلى الشجرة الجزئية. استنادًا إلى نظام الانتقال هذا، نطوّر مُحلّلًا قائمًا على التقدم التدريجي القوي. في كل خطوة، يُشفّر النظام الشجرة الجزئية باستخدام شبكة عصبية رسمية (Graph Neural Network) ويُنبّئ بالإجراء التالي. قمنا بتقييم المُحلّل لدينا على مجموعتي بيانات Penn Treebank (PTB) وChinese Treebank (CTB). على PTB، تفوق المُحلّل لدينا على المُحلّلات الحالية التي تم تدريبها باستخدام أشجار تركيبية فقط؛ كما حقق أداءً مماثلًا لأفضل المُحلّلات الحالية التي تستخدم أشجار اعتمادية كبيانات تدريب إضافية. أما على CTB، فقد حقق المُحلّل لدينا حالة جديدة من الأداء القياسي. يمكن الوصول إلى الكود عبر الرابط: https://github.com/princeton-vl/attach-juxtapose-parser.