منذ 2 أشهر
التعرف على الكيانات المسماة بين اللغات بدون موارد
M Saiful Bari; Shafiq Joty; Prathyusha Jwalapuram

الملخص
في الآونة الأخيرة، حققت الطرق العصبية نتائجًا رائدة في مهام التعرف على الكيانات المسماة (NER) لعدد من اللغات دون الحاجة إلى خصائص يدوية الصنع. ومع ذلك، لا تزال هذه النماذج بحاجة إلى بيانات تدريب تم تصنيفها يدويًا، والتي غير متاحة للعديد من اللغات. في هذا البحث، نقترح نموذجًا عابرًا للغات بدون إشراف للتعرف على الكيانات المسماة (NER) يمكنه نقل معرفة NER من لغة إلى أخرى بطريقة تمامًا بدون إشراف ولا يعتمد على أي قاموس ثنائي اللغة أو بيانات متوازية. يتمكن نموذجنا من تحقيق هذا من خلال التعلم المعادي على مستوى الكلمات والتحسين الدقيق المُعزَّز باستخدام مشاركة المعلمات وزيادة الخصائص. أظهرت التجارب التي أجريت على خمس لغات مختلفة فعالية نهجنا، حيث تفوق على النماذج الموجودة بمقدار كبير وأقام سجلًا جديدًا رائدًا لكل زوج من اللغات.