HyperAIHyperAI

Command Palette

Search for a command to run...

OntoGUM: تقييم حل المشكلات المعاصرة للربط السياقي على 12 نوعًا إضافيًا

Yilun Zhu Sameer Pradhan Amir Zeldes

الملخص

تحقيق أداء متفوق في حل الترابط (coreference resolution) يُظهر نتائج متزايدة التألق على معيار OntoNotes. ومع ذلك، فإن غياب بيانات مماثلة تتبع نفس المخطط لفئات نصية أكثر تنوعًا يجعل من الصعب تقييم قدرة النماذج على التعميم على بيانات من مجال مفتوح. تقدم هذه الورقة مجموعة بيانات وتقييمًا شاملاً يُظهر أن أنظمة النمذجة العصبية الحديثة القائمة على النماذج اللغوية (neural LM) تُظهر تدهورًا كبيرًا عند تطبيقها خارج المجال المُدرَّس. وقد قمنا بالإفصاح عن مجموعة بيانات تُسمى OntoGUM، وهي مُستوحاة من OntoNotes، مستخرجة من مختبر GUM، وهو مجموعة نصية إنجليزية تغطي 12 نوعًا نصيًا، باستخدام قواعد محددة، وقمنا بتقييمها. وبفضل التصنيفات النحوية والسردية الغنية الموجودة في GUM، تمكنا من إنشاء أكبر مجموعة نصية مُحدَّثة يدويًا للربط الترابط، وفقًا لمعايير OntoNotes، وهي أول مجموعة يتم تقييمها من حيث التوافق مع مخطط OntoNotes. أظهر التقييم خارج المجال عبر 12 نوعًا نصيًا تدهورًا بنسبة تصل إلى 15-20% لكل من النظم القائمة على القواعد المحددة والنُظم القائمة على التعلم العميق، مما يشير إلى نقص في القدرة على التعميم أو إلى تفادي مُخفي (covert overfitting) في نماذج حل الترابط الحالية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp