منذ 9 أيام
نسخة مُعادَة لنموذج LSTM ثنائي الاتجاه من شركة آبل لتحديد اللغة في السلاسل القصيرة
Mads Toftrup, Søren Asger Sørensen, Manuel R. Ciosici, Ira Assent

الملخص
تمييز اللغة هو المهمة التي تتمثل في تحديد لغة المستند. وفي التطبيقات مثل اختيار مصحح الإملاء تلقائيًا، يجب أن يستخدم تمييز اللغة سلاسل قصيرة جدًا، مثل أجزاء من رسائل النص. في هذه الدراسة، نعيد إنتاج بنية تمييز اللغة التي أشارت إليها آبل بشكل موجز في مقال مدونة. ونؤكد أداء نموذج البي-إتش-إس-تي إم (bi-LSTM)، ونجد أنه يتفوق على مُميّزات لغة مفتوحة المصدر الحالية. كما نلاحظ أن الأخطاء التي يرتكبها النموذج تعود إلى التباس بين اللغات المرتبطة ببعضها البعض.