تحسين التعرف على الكيانات المحددة من خلال استرجاع السياق الخارجي والتعلم التعاوني

أظهرت التطورات الحديثة في تمييز الكيانات المحددة (NER) أن السياقات على مستوى المستند يمكن أن تُحسّن بشكل كبير أداء النماذج. ومع ذلك، في العديد من السيناريوهات التطبيقية، لا تكون هذه السياقات متاحة. في هذه الورقة، نقترح استخلاص سياقات خارجية لجملة من خلال استرجاع مجموعة من النصوص ذات الصلة دلاليًا باستخدام محرك بحث، باستخدام الجملة الأصلية كمُسْتَخْرَج (Query). وجدنا تجريبيًا أن التمثيلات السياقية التي تُحسب على نموذج الإدخال المستند إلى الاسترجاع، والذي يُبنى عن طريق دمج الجملة مع سياقاتها الخارجية، يمكن أن تحقق أداءً مُحسّنًا بشكل ملحوظ مقارنة بنموذج الإدخال الأصلي الذي يعتمد فقط على الجملة. علاوةً على ذلك، يمكننا تحسين أداء النموذج على كلا نموذجَي الإدخال من خلال التعلّم التعاوني (Cooperative Learning)، وهي طريقة تدريب تشجع النموذجين على إنتاج تمثيلات سياقية متشابهة أو توزيعات علامات ناتجة متشابهة. تُظهر التجارب أن منهجنا يمكنه تحقيق أداءً جديدًا من أعلى المستويات على 8 مجموعات بيانات لـ NER تغطي 5 مجالات مختلفة.