مع زيادة السياقات، تتحسن الأداء: تضمينات المعنى المُحتَوَاة على سياق للفهم الشامل لمعاني الكلمات

تم استخدام التضمينات الكلمية السياقية بشكل فعّال في عدة مهام ضمن معالجة اللغة الطبيعية، نظرًا لبُعد قدرتها على حمل معلومات معنوية مفيدة. ومع ذلك، لا يزال من الصعب ربطها بمصادر معرفية منظمة. في هذا البحث، نقدّم ARES (تضمينات الوعي السياقي للدلالة)، وهي منهجية شبه مُراقبة لإنتاج تضمينات الدلالة للدلالات اللفظية داخل قاعدة معرفية لغوية، بحيث تقع في فضاء مماثل لفضاء المتجهات الكلمية السياقية. تتيح تمثيلات ARES استخدام خوارزمية الجار الأقرب (1 Nearest-Neighbour) البسيطة أن تتفوّق على النماذج الرائدة في مجال التمييز بين الدلالات الكلمية، ليس فقط في المهمة الإنجليزية، بل أيضًا في المهمة متعددة اللغات، مع تدريب نموذج على بيانات مُعلّمة دلاليًا باللغة الإنجليزية فقط. كما قمنا بتقييم جودة التضمينات لدينا في مهمة "الكلمة في السياق"، حيث أظهرت التضمينات، عند استخدامها كمصدر خارجي للمعرفة، تحسينًا مستمرًا في أداء النموذج العصبي، مما يمكّنه من المنافسة مع هياكل أكثر تعقيدًا. تُتاح تضمينات ARES لكل المفاهيم في WordNet، بالإضافة إلى السياقات التي تم استخلاصها تلقائيًا لتكوين تمثيلات الدلالة، مجانًا عبر الرابط: http://sensembert.org/ares.