منذ 4 أشهر

الندرة تُحدث معنى: التمييز بين المعاني الكلمية باستخدام تمثيلات كلمات سياقية نادرة

{G{\'a}bor Berend}

الملخص

في هذه الورقة، نُظهر أن استخدام تمثيلات كلمات نادرة يمكّن من تجاوز نتائج النماذج الأكثر تعقيدًا المصممة خصيصًا للمهام على مهمة تفسير المعنى الدقيق لكلمات النص. تعتمد الخوارزمية المقترحة على مجموعة زائدة من المتجهات الأساسية الدلالية، مما يسمح لنا بالحصول على تمثيلات كلمات مُتَنَوِّعة (سِبَارْس) في السياق. نُقدّم تمثيلًا مُستوحى من نظرية المعلومات لـ "السينسيت" (synset)، يقوم على تكرار ظهور معاني الكلمات مع إحداثيات غير صفرية للأشكال الكلمية، مما يُمكّننا من تحقيق معدّل F الإجمالي البالغ 78.8 على مزيج من خمسة مجموعات معيارية لاختبار تفسير المعنى للكلمات. كما نُظهر مدى إمكانية تعميم الإطار المقترح من خلال تقييمه على مهام تحديد الفئة النحوية (part-of-speech tagging) باستخدام أربع مجموعات بيانات مختلفة (treebanks). تشير نتائجنا إلى تحسين ملحوظ مقارنةً باستخدام التمثيلات الكثيفة للكلمات.

المعايير القياسية

معيار قياسي	المنهجية	المقاييس
word-sense-disambiguation-on-supervised	SparseLMMS+WNGC	SemEval 2007: 73.0 SemEval 2013: 79.4 SemEval 2015: 81.3 Senseval 2: 79.6 Senseval 3: 77.3
word-sense-disambiguation-on-supervised	SparseLMMS	SemEval 2007: 68.8 SemEval 2013: 76.1 SemEval 2015: 77.5 Senseval 2: 77.9 Senseval 3: 77.8

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي

وحدات معالجة رسومات جاهزة

أفضل الأسعار

ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp