HyperAIHyperAI
منذ 2 أشهر

التصنيف النحوي متعدد اللغات باستخدام نماذج الذاكرة طويلة المدى ثنائية الاتجاه والخسارة المساعدة

Barbara Plank; Anders Søgaard; Yoav Goldberg
التصنيف النحوي متعدد اللغات باستخدام نماذج الذاكرة طويلة المدى ثنائية الاتجاه والخسارة المساعدة
الملخص

شبكات الذاكرة طويلة المدى ثنائية الاتجاه (bi-LSTM) أثبتت نجاحها مؤخرًا في مهام نمذجة التسلسلات المختلفة في معالجة اللغة الطبيعية (NLP)، ولكن لا يزال هناك القليل من المعلومات حول اعتمادها على تمثيلات المدخلات، اللغات المستهدفة، حجم مجموعة البيانات، والضوضاء التصنيفية. نتناول هذه القضايا ونقيم شبكات bi-LSTM باستخدام تضمينات الكلمات، والتضمينات الحرفية، وتضمينات البايتات اليونيكود لتحديد الأدوار النحوية (POS tagging). نقارن بين شبكات bi-LSTM وال programs التقليدية لتحديد الأدوار النحوية عبر اللغات وأحجام البيانات. كما نقدم نموذجًا جديدًا لـ bi-LSTM يجمع بين دالة الخسارة لتحديد الأدوار النحوية ودالة خسارة معاونة تأخذ بعين الاعتبار الكلمات النادرة. يحقق هذا النموذج أداءً رائدًا في 22 لغة، ويتميز بأدائه الجيد خاصةً في اللغات ذات التركيب الصوتي المعقد. تشير تحليلاتنا إلى أن شبكات bi-LSTM أقل حساسية لحجم بيانات التدريب والتشوهات التصنيفية (بمستويات ضوضاء صغيرة) مما كان يُفترض سابقًا.