HyperAIHyperAI
منذ 2 أشهر

التمييز الاسمي العابر للغات من مصدر واحد أو مصادر متعددة عبر التعلم بين المعلم والطالب على البيانات غير المصنفة في اللغة الهدف

Qianhui Wu; Zijia Lin; Börje F. Karlsson; Jian-Guang Lou; Biqing Huang
التمييز الاسمي العابر للغات من مصدر واحد أو مصادر متعددة عبر التعلم بين المعلم والطالب على البيانات غير المصنفة في اللغة الهدف
الملخص

لتحسين التعامل مع مشكلة تحديد الكيانات المسماة (NER) في اللغات ذات البيانات المصنفة قليلة أو معدومة، يجب على التعلم العابر للغات في تحديد الكيانات المسماة أن يستغل بشكل فعال المعرفة المستفادة من اللغات المصدر التي تتمتع بكمية وافرة من البيانات المصنفة. ومع ذلك، فإن معظم الأعمال السابقة في مجال التعلم العابر للغات في تحديد الكيانات المسماة تعتمد على نقل التصنيفات باستخدام النصوص الثنائية أو نقل النموذج مباشرة. ولكن هذه الطرق إما لا تكون قابلة للتطبيق إذا كانت البيانات المصنفة في اللغات المصدر غير متاحة، أو لا تستغل المعلومات الموجودة في البيانات غير المصنفة في اللغة الهدف.في هذا البحث، نقترح طريقة تعليمية بين المعلم والطالب لمعالجة مثل هذه القيود، حيث يتم استخدام نماذج تحديد الكيانات المسماة في اللغات المصدر كمعلمين لتدريب نموذج الطالب على بيانات غير مصنفة في اللغة الهدف. تعمل الطريقة المقترحة لكل من التعلم العابر للغات في تحديد الكيانات المسماة من مصدر واحد ومن مصادر متعددة. وفي حالة الأخيرة، نقترح أيضًا طريقة لقياس الشبه لوزن الرقابة من نماذج مختلفة للمعلمين بشكل أفضل.أظهرت التجارب الواسعة التي أجريت على ثلاثة لغات هدف باستخدام مجموعات بيانات معيارية أن طريقتنا تتفوق على الأساليب الحالية الأكثر تقدمًا لكل من التعلم العابر للغات في تحديد الكيانات المسماة من مصدر واحد ومن مصادر متعددة.

التمييز الاسمي العابر للغات من مصدر واحد أو مصادر متعددة عبر التعلم بين المعلم والطالب على البيانات غير المصنفة في اللغة الهدف | أحدث الأوراق البحثية | HyperAI