HyperAIHyperAI
منذ 11 أيام

الحل التماثلي القائم على التعلم التعزيزي العميق للحل التماثلي النووي

{Hongliang Fei, Xu Li, Dingcheng Li, Ping Li}
الحل التماثلي القائم على التعلم التعزيزي العميق للحل التماثلي النووي
الملخص

أدى التقدم في النماذج الشبكية العصبية الحديثة إلى تحسين كبير في مهمة تحديد الارتباط المركزي (coreference resolution). ومع ذلك، فإن النماذج الحالية للارتباط المركزي القائمة على الشبكات العصبية تُدرَّب غالبًا باستخدام دوال خسارة تُطبَّق على تسلسل من القرارات المحلية. في هذا البحث، نقدّم نموذجًا مبنيًا على التعلّم بالتعزيز (reinforcement learning) من البداية إلى النهاية، يهدف إلى تحسين معاملات التقييم الخاصة بالارتباط المركزي بشكل مباشر. وبشكل خاص، نُعدّل النهج المتطور من التصنيف من الدرجة العليا للذكر (higher-order mention ranking) المقدّم في دراسة لي وآخرون (2018) ليصبح نموذجًا يعتمد على تدرج السياسة (policy gradient) من خلال دمج المكافأة المرتبطة بتسلسل إجراءات الربط الارتباطي. علاوةً على ذلك، نُقدّم تنظيمًا مبنيًا على ماكسيموم الإنتروبي (maximum entropy regularization) لضمان استكشاف كافٍ، مما يمنع النموذج من الانزلاق مبكرًا نحو حل محلي غير مثالي. وتمكّن النموذج المقترح من تحقيق أداءً جديدًا على مستوى الأداء الأفضل (state-of-the-art) في معيار اللغة الإنجليزية لبيانات OntoNotes v5.0.

الحل التماثلي القائم على التعلم التعزيزي العميق للحل التماثلي النووي | أحدث الأوراق البحثية | HyperAI