تحسين تغطية وقدرة التعميم في توضيح معنى الكلمات العصبية من خلال العلاقات الفوقية والتحتية

في توضيح معاني الكلمات (WSD)، يعتمد النهج السائد عادةً على نظام مراقب مدرب على نصوص مشمولة بتوضيح المعاني. ومع ذلك، فإن الكمية المحدودة لمثل هذه النصوص تقيّد نطاق وفعالية هذه الأنظمة. في هذا المقال، نقترح طريقة جديدة تحل هذه المشكلات من خلال الاستفادة من المعرفة الموجودة في WordNet، وبشكل خاص العلاقات الهيبرنيمية والهيبونيمية بين المجاميع اللفظية (synsets)، بهدف تقليل عدد العلامات الدلالية المختلفة اللازمة لتوضيح معاني جميع الكلمات في قاعدة البيانات اللفظية. تؤدي طرقتنا إلى تحقيق نتائج رائدة في معظم مهام تقييم WSD، بينما تحسن من نطاق الأنظمة المراقبة وتقلل من وقت التدريب وحجم النماذج، دون الحاجة إلى بيانات تدريب إضافية. بالإضافة إلى ذلك، نعرض نتائجًا تتخطى بشكل كبير الحالة الرائدة عندما يتم دمج طرقتنا مع تقنية التجميع وإضافة WordNet Gloss Tagged كنص للتدريب.