طرح أسئلة فعّالة ومتنوعة: إطار يعتمد على فهم القراءة الآلية لاستخراج الكيانات والعلاقات بشكل مشترك

أحدث التطورات تُحوِّل مهمة استخراج الكيانات والعلاقات إلى مهمة إجابة متعددة الدورات على أسئلة (QA)، وتوفر حلًا فعّالًا يستند إلى نماذج فهم القراءة الآلية (MRC). ومع ذلك، تستخدم هذه النماذج سؤالًا واحدًا لتمثيل معنى الكيانات والعلاقات، وهو ما يُعد غير كافٍ بشكل مُباشر نظرًا لتعدد معاني السياق. علاوةً على ذلك، تقوم النماذج الحالية بتمييز جميع أنواع العلاقات لإنشاء الأسئلة، وهو ما يُعد غير كفؤ ويؤدي بسهولة إلى طرح أسئلة مُربكة. في هذه الورقة، نُحسّن النموذج القائم على MRC لاستخراج الكيانات والعلاقات من خلال آلية إجابة متنوعة. أولاً، نُقدّم آلية إجابة متنوعة للكشف عن فترات الكيانات، ونُصمم استراتيجيتين لاختيار الإجابات لدمج الإجابات المختلفة. ثم، نقترح التنبؤ بجزء من العلاقات المحتملة وحذف العلاقات غير ذات صلة لاستخراج الأسئلة بكفاءة. وأخيرًا، ندمج استخراج الكيانات والعلاقات بطريقة نهائية متكاملة (end-to-end) ونُحسّنها من خلال التعلم المشترك. أظهرت نتائج التجارب أن الطريقة المقترحة تتفوّق بشكل ملحوظ على النماذج الأساسية، حيث رفعت دقة العلاقة (F1) إلى 62.1% (+1.9%) على مجموعة بيانات ACE05 و71.9% (+3.0%) على مجموعة بيانات CoNLL04. يمكن الوصول إلى التنفيذ العملي للنظام عبر الرابط: https://github.com/TanyaZhao/MRC4ERE.