منذ 2 أشهر
عديد من اللغات، ومحرك تحليل واحد
Waleed Ammar; George Mulcaire; Miguel Ballesteros; Chris Dyer; Noah A. Smith

الملخص
نقوم بتدريب نموذج متعدد اللغات للتحليل الصرفي ونستخدمه لتحليل الجمل في عدة لغات. يستخدم النموذج التحليلي (أ) مجموعات الكلمات المضمنة المتعددة اللغات والمتجهات الدلالية؛ (ب) معلومات اللغة على مستوى الوحدة النصية؛ و(ج) الخصائص الخاصة باللغة (العلامات الصرفية الدقيقة). يمكّن هذا التمثيل الإدخالي المحرك التحليلي من تحليل الجمل بشكل فعال في العديد من اللغات، بالإضافة إلى تعميم الأداء عبر اللغات بناءً على الثوابت اللغوية والتشابهات الأصنافية، مما يجعله أكثر فعالية في التعلم من التسميات المحدودة. أداء محركنا التحليلي يقارن بشكل ملائم مع الخطوط الأساسية القوية في مجموعة متنوعة من سيناريوهات البيانات، بما في ذلك عندما تكون اللغة المستهدفة لديها قاعدة بيانات شجرية كبيرة، أو قاعدة بيانات شجرية صغيرة، أو لا توجد قاعدة بيانات شجرية للتدريب.