التعلم متعدد المقاييس النحوي لاستخراج المعلومات المفتوحة

استخلاص المعلومات المفتوح (Open Information Extraction) يهدف إلى استخراج زوجيات علاقاتية من جمل في مجال مفتوح. تم تطوير نماذج قواعدية أو إحصائية تقليدية بناءً على الهياكل النحوية للجمل، التي تم تحديدها بواسطة مُحلّلات نحوية. ومع ذلك، فإن النماذج العصبية السابقة لاستخلاص المعلومات المفتوح لم تستغل بشكل كافٍ المعلومات النحوية المفيدة. في هذا البحث، نُمثل كلًا من أشجار التراكيب (constituency) وأشجار الاعتماد (dependency) كرسوم بيانية على مستوى الكلمات، ونُمكّن النماذج العصبية لاستخلاص المعلومات المفتوح من التعلم من الهياكل النحوية. ولتحسين دمج المعلومات المتنوعة المستمدة من الرسمين، نعتمد نموذج التعلم متعدد المنظورات (multi-view learning) لاستخلاص العلاقات المتعددة منهما. وأخيرًا، نجمع التمثيلات المُعدّلة لأشجار التراكيب والاعتماد مع التمثيلات الدلالية للجملة لغرض إنشاء الزوجيات. تُظهر التجارب أن المعلومات المتعلقة بأشجار التراكيب والاعتماد، فضلًا عن نموذج التعلم متعدد المنظورات، فعّالة جدًا.