إدخال معلومات قاعدة المعرفة في استخراج الكيان والعلاقة المتزامن النهائياً والحل التناهي للإشارة

نُعتبر نموذجًا مُجمَّعًا لاستخراج المعلومات (IE)، يُحلّل بشكل مُتكامل تحديد الكيانات المُعرفة، وحلّ الترابط الاسمي، واستخراج العلاقات عبر المستند بأكمله. وتحديدًا، ندرس كيفية دمج المعلومات من قاعدة معرفية (KB) في هذا النموذج، وذلك بناءً على ربط الكيانات غير المُدرَّبة (unsupervised entity linking). وتُستخلَص تمثيلات الكيانات في قاعدة المعرفة المستخدمة من إما (i) المستندات النصية المرتبطة بروابط تشعبية (مثل ويكيبيديا)، أو (ii) رسم معرفي (Wikidata)، وتُبيّن هذه التمثيلات تكاملًا متبادلًا في تحسين أداء استخراج المعلومات. ويتم إضافة تمثيلات المرشحين لربط الكيانات (EL) إلى تمثيلات النطاقات النصية في المستند المدخل، ونختبر (i) أخذ متوسط موزون لتمثيلات مرشحي EL بناءً على احتمالاتهم الأولية (في ويكيبيديا)، و(ii) استخدام آلية انتباه (attention) على قائمة مرشحي EL. تُظهر النتائج ارتفاعًا يصل إلى 5% في دقة F1 لمهام استخراج المعلومات المُختبرة على مجموعتي بيانات. وعلى الرغم من الأداء القوي للنموذج القائم على الاحتمال الأولي، فإن التحليل الكمي والكيفي يُظهران الميزة النسبية لاستخدام النهج القائم على الانتباه.