الندرة تُحدث معنى: التمييز بين المعاني الكلمية باستخدام تمثيلات كلمات سياقية نادرة
{G{\'a}bor Berend}

الملخص
في هذه الورقة، نُظهر أن استخدام تمثيلات كلمات نادرة يمكّن من تجاوز نتائج النماذج الأكثر تعقيدًا المصممة خصيصًا للمهام على مهمة تفسير المعنى الدقيق لكلمات النص. تعتمد الخوارزمية المقترحة على مجموعة زائدة من المتجهات الأساسية الدلالية، مما يسمح لنا بالحصول على تمثيلات كلمات مُتَنَوِّعة (سِبَارْس) في السياق. نُقدّم تمثيلًا مُستوحى من نظرية المعلومات لـ "السينسيت" (synset)، يقوم على تكرار ظهور معاني الكلمات مع إحداثيات غير صفرية للأشكال الكلمية، مما يُمكّننا من تحقيق معدّل F الإجمالي البالغ 78.8 على مزيج من خمسة مجموعات معيارية لاختبار تفسير المعنى للكلمات. كما نُظهر مدى إمكانية تعميم الإطار المقترح من خلال تقييمه على مهام تحديد الفئة النحوية (part-of-speech tagging) باستخدام أربع مجموعات بيانات مختلفة (treebanks). تشير نتائجنا إلى تحسين ملحوظ مقارنةً باستخدام التمثيلات الكثيفة للكلمات.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| word-sense-disambiguation-on-supervised | SparseLMMS+WNGC | SemEval 2007: 73.0 SemEval 2013: 79.4 SemEval 2015: 81.3 Senseval 2: 79.6 Senseval 3: 77.3 |
| word-sense-disambiguation-on-supervised | SparseLMMS | SemEval 2007: 68.8 SemEval 2013: 76.1 SemEval 2015: 77.5 Senseval 2: 77.9 Senseval 3: 77.8 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.