تقييم تأثير السياق الرسومي المعرفي على نماذج تفادي التحديد غير المحدد للكيانات

أصبحت نماذج التحويلة المُدرّبة مسبقًا (Pretrained Transformer models) من أحدث الأساليب التي تتعلم المعلومات السياقية من النص لتحسين أداء العديد من المهام في معالجة اللغة الطبيعية (NLP). وعلى الرغم من قوتها، فإن هذه النماذج ما زالت تتطلب معرفة متخصصة في سياقات معينة. في هذا البحث، نجادل بأن السياق المستمد من الرسم المعرفي (Knowledge Graph)، وفي حالتنا: ويكي داتا (Wikidata)، يوفر إشارات كافية لتحسين أداء نماذج التحويلة المُدرّبة مسبقًا في مهمة التمييز بين الكيانات الاسمية (Named Entity Disambiguation - NED) ضمن الرسم المعرفي لويكي داتا. كما نفترض أن السياق المعرفي المُقترح يمكن توحيد استخدامه لصالح ويكيبيديا، ونقيّم تأثير هذا السياق المعرفي على النموذج الحاصل على أحدث الأداء في مهمة NED ضمن قاعدة بيانات ويكيبيديا. وتدعم النتائج التجريبية أن السياق المعرفي المقترح يمكن تعميمه (على ويكيبيديا)، وأن إدخال السياق المعرفي في هياكل التحويلة يؤدي إلى أداء متفوق بشكل كبير مقارنة بالأساليب السابقة، بما في ذلك نماذج التحويلة القياسية (vanilla transformer models).