InferNER: نموذج مُنتَبِه يستفيد من المعلومات على مستوى الجملة للتعرف على الكيانات المحددة في المدونات القصيرة
نُجري دراسة حول مشكلة التعرف على الكيانات المُحددة في النصوص التي يُنشئها المستخدمون، مثل منشورات وسائل التواصل الاجتماعي. وتُعد هذه المهمة صعبة بشكل خاص بسبب القيود المفروضة على الطول، والانعدام النسبي في الترابط النحوي لهذه البيانات. تعتمد الطرق الحالية المتطورة على مصادر خارجية مثل قوائم المراجع (Gazetteers) لتخفيف بعض هذه القيود. ونُقدّم نموذجًا عصبيًا قادرًا على التفوق على الحد الأقصى المُتاح من الأداء الحالي دون اللجوء إلى قوائم المراجع أو أي مصادر خارجية مشابهة. يعتمد نهجنا على معلومات على مستويات الكلمة، والحرف، والجملة، في التعرف على الكيانات المُحددة في النصوص القصيرة. غالبًا ما تكون منشورات وسائل التواصل الاجتماعي، مثل التغريدات، مرتبطة بصورة تُوفر سياقًا مساعدًا مرتبطًا بالنص، مما يُسهم في فهمه بشكل أفضل. وبالتالي، نُدمج أيضًا المعلومات البصرية، ونُقدّم مكوّنًا للانتباه (attention) يُحسب احتمالات أوزان الانتباه بشكل منفصل على السياق النصي والصوري المرتبط بالنص. يتفوق نموذجنا على الحد الأقصى المُتاح من الأداء الحالي على مجموعة متنوعة من مجموعات بيانات التعرف على الكيانات المُحددة. حيث حقق نموذجنا تقييمات F1 قدرها 53.48% و50.52% على مجموعتي بيانات WNUT 2016 و2017 على التوالي. وبالإضافة إلى ذلك، حقق النظام المُدمج (Multimodal) أداءً يتفوق على الحد الأقصى المُتاح من الأداء الحالي، بتحقيقه معدل F1 بلغ 74% على مجموعة بيانات متعددة الوسائط. كما تُشير تقييماتنا إلى أن النموذج يتفوق أيضًا على الحد الأقصى المُتاح من الأداء الحالي في بيانات الصحف (newswire)، مما يؤكد ملاءمته لمهام التعرف على الكيانات المُحددة في سياقات مختلفة.