التوجيه بالاعتماد على نموذج LSTM-CRF لاستخراج الكيانات المحددة

تحتوي هياكل الأشجار الارتباطية على العلاقات بعيدة المدى والعلاقات النحوية بين الكلمات في الجملة. يمكن أن تُستنتج من العلاقات النحوية (مثل الفاعل الاسمي، المفعول به) وجود كيانات معرفة معينة. بالإضافة إلى ذلك، يمكن أن يستفيد أداء معالج الكيانات المعرفة من العلاقات البعيدة المدى بين الكلمات في أشجار الارتباط. في هذا العمل، نقترح نموذجًا بسيطًا لكنه فعّالًا يعتمد على الارتباطات (LSTM-CRF) لتمثيل الأشجار الارتباطية الكاملة وتمييز الخصائص المذكورة أعلاه في مهمة التعرف على الكيانات المعرفة (NER). تُظهر إحصائيات البيانات ارتباطًا قويًا بين أنواع الكيانات والعلاقات الارتباطية. قمنا بتجارب واسعة النطاق على عدة مجموعات بيانات قياسية وأثبتنا فعالية النموذج المقترح في تحسين أداء التعرف على الكيانات المعرفة والوصول إلى أداء متفوق على المستوى العالمي. وتكشف تحليلاتنا أن التحسينات الكبيرة تأتي في المقام الأول من العلاقات الارتباطية والتفاعلات البعيدة المدى التي توفرها أشجار الارتباط.