HyperAIHyperAI
منذ 11 أيام

على التعميم في تحديد المرجعية

Shubham Toshniwal, Patrick Xia, Sam Wiseman, Karen Livescu, Kevin Gimpel
على التعميم في تحديد المرجعية
الملخص

بينما يُعرّف حل التماثل (coreference resolution) بشكل مستقل عن مجال مجموعة البيانات، فإن معظم النماذج المستخدمة في تنفيذ حل التماثل لا تنتقل بفعالية إلى مجالات غير مرئية. نقوم بجمع مجموعة من 8 مجموعات بيانات لحل التماثل، تهدف إلى مجالات مختلفة، لتقييم أداء النماذج الجاهزة (off-the-shelf). ثم نُدمج ثلاث مجموعات بيانات لتدريب نموذج واحد؛ ورغم اختلاف مجالاتها، ومبادئ الترميز (annotation guidelines)، وبياناتها الوصفية (metadata)، نقترح طريقة لتدريب نموذج واحد بشكل مشترك على هذه المجموعة المختلطة من البيانات، باستخدام تكبير البيانات (data augmentation) لمعالجة الفروق في الترميز، واستخدام عينات متوازنة (sampling) لموازنة كميات البيانات. ونجد أن النماذج المدربة على مجموعة بيانات واحدة فقط تُظهر أداءً ضعيفًا في البيئة صفرية المعرفة (zero-shot)، بينما يؤدي التدريب المشترك إلى تحسين الأداء العام، مما يؤدي إلى تعميم أفضل في نماذج حل التماثل. تُسهم هذه الدراسة في إنشاء معيار جديد (benchmark) لحل التماثل المُتماسك، وتُقدّم نتائج جديدة تُعدّ من أحدث النتائج في مجالها.

على التعميم في تحديد المرجعية | أحدث الأوراق البحثية | HyperAI