ضغط مفردات المعنى من خلال المعرفة الدلالية لـ WordNet للتمييز بين معاني الكلمات العصبية

في هذا المقال، نتناول مشكلة الكمية المحدودة من المجموعات النصية التي تم توضيح معاني كلماتها يدويًا للمهمة الخاصة بتحديد معنى الكلمة (Word Sense Disambiguation)، وذلك من خلال استغلال العلاقات الدلالية بين المعاني مثل الترادف والعمومية والخصوصية، بهدف تقليص مفردات المعاني في شبكة معاني برينستون (Princeton WordNet)، وبالتالي تقليل عدد علامات المعنى المختلفة التي يجب ملاحظتها لتحديد معاني جميع الكلمات في قاعدة البيانات اللغوية. نقترح طريقتين مختلفتين تقللان بشكل كبير حجم النماذج العصبية لتحديد معنى الكلمة (WSD)، مع فائدة تحسين تغطيتها دون الحاجة إلى بيانات تدريب إضافية، وعدم التأثير على دقتها. بالإضافة إلى طريقة عملنا، نقدم نظامًا لتحديد معنى الكلمة (WSD) يعتمد على متجهات الكلمات المدربة مسبقًا باستخدام BERT لتحقيق نتائج تتفوق بشكل كبير على أفضل ما وصل إليه العلم في جميع مهمات تقييم تحديد معنى الكلمة (WSD).