HyperAIHyperAI
منذ شهر واحد

التصنيف الدقيق للكلمات حسب موقعها في الجملة متعدد اللغات من خلال التدريب المعادي

Michihiro Yasunaga; Jungo Kasai; Dragomir Radev
التصنيف الدقيق للكلمات حسب موقعها في الجملة متعدد اللغات من خلال التدريب المعادي
الملخص

التدريب المعادي (AT) هو طريقة تنظيمية قوية للشبكات العصبية، تهدف إلى تحقيق متانة ضد الاضطرابات في المدخلات. ومع ذلك، لا تزال الآثار الخاصة للمتانة التي يتم الحصول عليها من التدريب المعادي غير واضحة في سياق معالجة اللغة الطبيعية. في هذا البحث، نقترح ونحلل نموذج تصنيف الأدوار النحوية العصبي الذي يستفيد من التدريب المعادي. في تجاربنا على مكتبة Penn Treebank WSJ وقاعدة بيانات Universal Dependencies (UD) (27 لغة)، نجد أن التدريب المعادي يحسن دقة التصنيف الشاملة فحسب، بل يحقق أيضًا 1) منع الانسياق الزائد بشكل جيد في اللغات ذات الموارد المنخفضة و2) زيادة دقة التصنيف للألفاظ النادرة / غير المرئية. كما نوضح أن 3) الأداء المتقدم في تصنيف الأدوار النحوية بفضل التدريب المعادي يساهم في مهمة التحليل الدالّي اللاحقة، وأن 4) التدريب المعادي يساعد النموذج على تعلم تمثيلات كلمات أكثر نقاءً. 5) النموذج المقترح باستخدام التدريب المعادي فعال بشكل عام في مهام تصنيف المتتاليات المختلفة. هذه النتائج الإيجابية تحفز على استخدام مزيد من التدريب المعادي للمهام المتعلقة باللغة الطبيعية.

التصنيف الدقيق للكلمات حسب موقعها في الجملة متعدد اللغات من خلال التدريب المعادي | أحدث الأوراق البحثية | HyperAI