التعرف على الكيانات المحددة في نصوص وسائل التواصل الاجتماعي باستخدام تعزيز الدلالة

تعاني الطرق الحالية لتحديد الكيانات المعرفة من مشكلة ندرة البيانات عند تطبيقها على النصوص القصيرة وغير الرسمية، خاصة المحتوى الذي ينشئه المستخدمون على وسائل التواصل الاجتماعي. وتشكل التضخيم الدلالي طريقة محتملة لتخفيف هذه المشكلة. نظرًا لأن المعلومات الدلالية الغنية محفوظة ضمنًا في تضمينات الكلمات المُدرّبة مسبقًا، فإنها تمثل موارد مثالية محتملة للتضخيم الدلالي. في هذا البحث، نقترح منهجًا قائمًا على الشبكات العصبية لتحديد الكيانات المعرفة في النصوص الاجتماعية، حيث يُؤخذ بعين الاعتبار كل من الدلالة المحلية (المستمدة من النص نفسه) والدلالة المُضخَّمة. وبشكل خاص، نستخلص المعلومات الدلالية المُضخَّمة من مجموعة نصية كبيرة، ونُقدِّم وحدة تضخيم دلالي مُنتبهة ووحدة مفتاح (Gate Module) لتمثيل ودمج هذه المعلومات على التوالي. أجرينا تجارب واسعة على ثلاث مجموعات معيارية تم جمعها من منصات وسائل التواصل الاجتماعي الإنجليزية والصينية، وأظهرت النتائج تفوق منهجنا على الدراسات السابقة في جميع المجموعات الثلاث.