SANDWiCH: التحليل الدلالي للجيران لتحديد المعنى الدقيق للكلمات في السياق حسب الحاجة

ارتفع الطلب على نماذج اللغة الكبيرة القائمة على الدردشة التوليدية (LLMs) خلال العامين الماضيين، مما أثار سباقًا لتطوير أنظمة توفر تجارب حوارية واستنتاجية تشبه إلى حد بعيد ما يمتلكه البشر. ومع ذلك، تشير دراسات حديثة إلى أن قدرة هذه النماذج على فهم اللغة ما زالت محدودة، ولا تزال بعيدة عن الأداء البشري، خاصة في فهم المعاني السياقية للكلمات، وهي جوانب أساسية في عملية الاستنتاج. في هذا البحث، نقدم إطارًا بسيطًا ولكنه فعّال من حيث الحوسبة لتحديد المعنى المتعدد للكلمات (WSD) متعدد اللغات. ونعيد صياغة مهمة WSD كتحليل تمييز بين المجموعات في شبكة معنوية تم تحسينها من خلال BabelNet باستخدام الجبر الجماعي. ونختبر منهجيتنا عبر عدة معايير لـ WSD، ونحقق حالة جديدة من الأداء الريادي في جميع اللغات والمهمات، وكذلك في التقييمات الفردية حسب نوع الكلمة (الاسم، الفعل، إلخ). ومن الملاحظ بوضوح أن نموذجنا يتفوق بشكل كبير على البدائل الحالية، حتى في اللغات ذات الموارد المحدودة، مع تقليل عدد المعلمات بنسبة 72%.