منذ 17 أيام
UWB في مهمة SemEval-2018 المهمة 10: التقاط السمات التمييزية من توزيعات الكلمات
{Tom{\'a}{\v{s}} Hercig, Tom{\'a}{\v{s}} Brychc{\'\i}n, Michal Konkol, Josef Steinberger}

الملخص
نقدّم نظامنا المبني على الموجات الواسعة النطاق (UWB) لمهام التقاط السمات التمييزية في مسابقة SemEval 2018. عند تزويد النظام بحَرفين وسمة معينة، يُحدّد النظام ما إذا كانت هذه السمة تميّز بين الحرفين أم لا. بافتراض فرضية التوزيع (Distributional Hypothesis)، أي أن معنى الكلمة مرتبط بتوزيعها في السياقات المختلفة، نقدّم عدة مناهج لمقارنة المعلومات السياقية للكلمات. وقد قمنا بتجريب الفضاءات الدلالية المتطورة حديثًا، بالإضافة إلى إحصائيات التكرار البسيطة. ونُظهر أن توزيع الكلمات في المجموعة النصية يمتلك إمكانات كبيرة في اكتشاف السمات التمييزية. وحقق نظامنا معدل F1 قدره 72.1%، وتصدر المركز الرابع من أصل 26 نظامًا تم تقديمه.