منذ 2 أشهر
تقييم التضمينات السياقية في 54 لغة في تصنيف الأجزاء النحوية، والتقليل، وتحليل الارتباط
Milan Straka; Jana Straková; Jan Hajič

الملخص
نقدم تقييمًا شاملاً لثلاثة طرق مقترحة حديثًا للتمثيلات السياقية على 89 مجمع نصوص في 54 لغة من الإصدار 2.3 للاعتمادات العالمية (Universal Dependencies) في ثلاث مهام: وسم الأجزاء النحوية، التحويل إلى الجذر، وتحليل الاعتماد. باستخدام BERT وFlair وELMo كمدخلات تمثيلات مسبقة التدريب في نظام قوي هو UDPipe 2.0، وهو أحد أفضل الأنظمة في مهمة CoNLL 2018 المشتركة وفائز عام بجائزة EPE 2018، نقدم مقارنة مباشرة بين الثلاثة طرق للتمثيلات السياقية للكلمات، بالإضافة إلى مقارنة مع التمثيلات المسبقة التدريب التي تشبه word2vec ومع التمثيلات الحرفية من البداية إلى النهاية. نبلغ عن نتائج رائدة في جميع الثلاثة مهام عند مقارنتها بالنتائج على UD 2.2 في مهمة CoNLL 2018 المشتركة.