منذ 17 أيام
ADAPT في مهام SemEval-2018 المهمة 9: تمثيلات كلمات Skip-Gram لاكتشاف الهيبرنيم غير المُدرَّب في المجموعات المتخصصة
{Filip Klubi{\v{c}}ka, Alfredo Maldonado}

الملخص
يصف هذا البحث نظامًا غير مُراقب بسيطًا ولكنه مُنافس في اكتشاف المُتَوَسِّطات (hypernyms). يستخدم النظام تمثيلات كلمات من نوع skip-gram مع عينة سلبية، ويُدرَّب على مجموعات نصية متخصصة. ويُقدَّر المرشحون المحتملون للمُتَوَسِّطات لكلمة مدخلة بناءً على معدلات التشابه الجيبي (cosine similarity). تم تدريب نوعين من نماذج تمثيلات الكلمات بشكل منفصل على مجموعتين نصيتين متخصصتين: مجموعة نصية طبية ومجموعة نصية في صناعة الموسيقى. وقد حقق نظامنا أعلى التصنيفات في المجال الطبي مقارنة بالنُظم غير المراقبة المنافسة، لكنه أظهر أداءً ضعيفًا في مجال صناعة الموسيقى. ولا يعتمد نظامنا على أي بيانات خارجية سوى المجموعات النصية الخام المتخصصة.