تصنيف الأدوار الدلالية كتحليل الارتباط: استكشاف الهياكل الشجرية الكامنة داخل الحجج

التصنيف الدلالي للدور (SRL) هو مهمة أساسية ومعقدة في مجتمع معالجة اللغة الطبيعية (NLP). تتركز الأعمال الحديثة في مجال SRL على مسارين رئيسيين: 1) استنادًا إلى نموذج BIO؛ 2) استنادًا إلى الفواصل (span). رغم شيوعها، فإن هذه الأساليب تشترك في بعض العيوب الجوهرية التي تتمثل في عدم اعتبارها الهياكل الداخلية للحُجج، مما قد يعيق قدرة النموذج على التعبير. التحدي الرئيسي يتمثل في أن الحُجج هي هياكل مسطحة وليس هناك تحققات فرعية محددة لكلمات داخل الحُجج. لحل هذه المشكلة، نقترح في هذا البحث اعتبار الفواصل المسطحة للحُجج كفرعيات خفية، وبالتالي تقليل SRL إلى مهمة تحليل الأشجار. بشكل خاص، نزوّد صيغتنا بـ TreeCRF مقيد بالفواصل جديدة لجعل هياكل الأشجار واعية بالفواصل ونسعى لتوسيعها إلى الحالة من الدرجة الثانية. أجرينا تجارب واسعة على مقاييس CoNLL05 وCoNLL12. كشفت النتائج أن طرقنا أداءها أفضل بكثير من جميع الأعمال السابقة التي لا تعتمد على النحو، حيث حققت أفضل مستوى حتى الآن تحت كلتا الإعداديتين: من البداية إلى النهاية والمعروفة المسبقاً بالحُجج (w/ gold predicates).