HyperAIHyperAI
منذ 11 أيام

إدخال معلومات قاعدة المعرفة في استخراج الكيان والعلاقة المتزامن النهائياً والحل التناهي للإشارة

Severine Verlinden, Klim Zaporojets, Johannes Deleu, Thomas Demeester, Chris Develder
إدخال معلومات قاعدة المعرفة في استخراج الكيان والعلاقة المتزامن النهائياً والحل التناهي للإشارة
الملخص

نُعتبر نموذجًا مُجمَّعًا لاستخراج المعلومات (IE)، يُحلّل بشكل مُتكامل تحديد الكيانات المُعرفة، وحلّ الترابط الاسمي، واستخراج العلاقات عبر المستند بأكمله. وتحديدًا، ندرس كيفية دمج المعلومات من قاعدة معرفية (KB) في هذا النموذج، وذلك بناءً على ربط الكيانات غير المُدرَّبة (unsupervised entity linking). وتُستخلَص تمثيلات الكيانات في قاعدة المعرفة المستخدمة من إما (i) المستندات النصية المرتبطة بروابط تشعبية (مثل ويكيبيديا)، أو (ii) رسم معرفي (Wikidata)، وتُبيّن هذه التمثيلات تكاملًا متبادلًا في تحسين أداء استخراج المعلومات. ويتم إضافة تمثيلات المرشحين لربط الكيانات (EL) إلى تمثيلات النطاقات النصية في المستند المدخل، ونختبر (i) أخذ متوسط موزون لتمثيلات مرشحي EL بناءً على احتمالاتهم الأولية (في ويكيبيديا)، و(ii) استخدام آلية انتباه (attention) على قائمة مرشحي EL. تُظهر النتائج ارتفاعًا يصل إلى 5% في دقة F1 لمهام استخراج المعلومات المُختبرة على مجموعتي بيانات. وعلى الرغم من الأداء القوي للنموذج القائم على الاحتمال الأولي، فإن التحليل الكمي والكيفي يُظهران الميزة النسبية لاستخدام النهج القائم على الانتباه.

إدخال معلومات قاعدة المعرفة في استخراج الكيان والعلاقة المتزامن النهائياً والحل التناهي للإشارة | أحدث الأوراق البحثية | HyperAI