التعرف على الدلالة اللفظية

في الدلالة اللفظية، تُعالج عادةً مسألة تقسيم الجملة الكاملة وتحديد العلامات على الأجزاء بشكل منفصل، رغم ترابطها المتبادل. نحن نفترض أن المهمة الموحّدة لتمييز الدلالة اللفظية تمثل طريقة فعّالة لدمج الأساليب المختلفة السابقة للتأشير، بما في ذلك تحديد وتصنيف التعبيرات متعددة الكلمات ووضع العلامات الفائقة (supersense tagging). وباستخدام مجموعة بيانات STREUSLE، نُدرّب نموذجًا لصيغة التصنيف التسلسلي العصبي (neural CRF sequence tagger) ونقيّم أداؤه من خلال محاور متعددة من التأشير. وبما أن مجموعة العلامات تعمّم تلك المستخدمة في المهام السابقة (PARSEME، DiMSUM)، فإننا نقيّم أيضًا مدى قدرة النموذج على التعميم على تلك المجموعات المختبرية، ونجد أن أداؤه يقترب من النماذج الحالية أو يفوقها، رغم تدريبه فقط على مجموعة STREUSLE. كما تُسهم أبحاثنا في إرساء نماذج أساسية ومقاييس تقييم مناسبة لتمثيل دقيق ومتكامل للدلالة اللفظية، مما يسهّل الأبحاث المستقبلية في هذا المجال.