التمييز الاسمي العابر للغات من مصدر واحد أو مصادر متعددة عبر التعلم بين المعلم والطالب على البيانات غير المصنفة في اللغة الهدف

لتحسين التعامل مع مشكلة تحديد الكيانات المسماة (NER) في اللغات ذات البيانات المصنفة قليلة أو معدومة، يجب على التعلم العابر للغات في تحديد الكيانات المسماة أن يستغل بشكل فعال المعرفة المستفادة من اللغات المصدر التي تتمتع بكمية وافرة من البيانات المصنفة. ومع ذلك، فإن معظم الأعمال السابقة في مجال التعلم العابر للغات في تحديد الكيانات المسماة تعتمد على نقل التصنيفات باستخدام النصوص الثنائية أو نقل النموذج مباشرة. ولكن هذه الطرق إما لا تكون قابلة للتطبيق إذا كانت البيانات المصنفة في اللغات المصدر غير متاحة، أو لا تستغل المعلومات الموجودة في البيانات غير المصنفة في اللغة الهدف.في هذا البحث، نقترح طريقة تعليمية بين المعلم والطالب لمعالجة مثل هذه القيود، حيث يتم استخدام نماذج تحديد الكيانات المسماة في اللغات المصدر كمعلمين لتدريب نموذج الطالب على بيانات غير مصنفة في اللغة الهدف. تعمل الطريقة المقترحة لكل من التعلم العابر للغات في تحديد الكيانات المسماة من مصدر واحد ومن مصادر متعددة. وفي حالة الأخيرة، نقترح أيضًا طريقة لقياس الشبه لوزن الرقابة من نماذج مختلفة للمعلمين بشكل أفضل.أظهرت التجارب الواسعة التي أجريت على ثلاثة لغات هدف باستخدام مجموعات بيانات معيارية أن طريقتنا تتفوق على الأساليب الحالية الأكثر تقدمًا لكل من التعلم العابر للغات في تحديد الكيانات المسماة من مصدر واحد ومن مصادر متعددة.