تدريب مُحلِّل التركيب النحوي غير المُشرف عليه باستخدام الإشراف الضعيف

نقدم طريقة لتحليل الجمل بدون إشراف تعتمد على تدريب المصنفات (bootstrapping classifiers) لاكتشاف ما إذا كان عقد معين يهيمن على فترة محددة في الجملة. هناك نوعان من المصنفات، الأول هو مصنف داخلي يعمل على فترة معينة، والثاني هو مصنف خارجي يعمل على كل شيء خارج هذه الفترة. من خلال التدريب الذاتي والتدريب التعاوني بين المصنفين الاثنين، نوضح أن التفاعل بينهما يساعد في تحسين دقة كلاهما، وبالتالي يساهم في تحليل الجمل بشكل فعال. تقنية التدريب الأولي (seed bootstrapping) تعد البيانات لتدريب هذه المصنفات. تؤكد تحليلاتنا أيضًا أن مثل هذا النهج بالاشتراك مع الإشراف الضعيف باستخدام المعرفة السابقة حول الفروع في لغة معروفة (الفرع الأيسر/الأيمن) وباستخدام قليل من القواعد التجريبية يحقن الانحياز الاستقرائي القوي في محرك التحليل، مما يحقق درجة F$_1$ بلغت 63.1 على مجموعة اختبار اللغة الإنجليزية (PTB). بالإضافة إلى ذلك، نظهر فعالية هندستتنا عن طريق تقييمها على شجرتي البيانات لللغتين الصينية (CTB) واليابانية (KTB)، ونحقق نتائج جديدة رائدة في المجال. يمكن الوصول إلى شفرتنا وموديلاتنا المدربة مسبقًا عبر الرابط: https://github.com/Nickil21/weakly-supervised-parsing.