HyperAIHyperAI
منذ 3 أشهر

CAW-coref: حل التماثل على مستوى الكلمة مع الانتباه إلى الحروف الربطية

Karel D&#39, Oosterlinck, Semere Kiros Bitew, Brandon Papineau, Christopher Potts, Thomas Demeester, Chris Develder
CAW-coref: حل التماثل على مستوى الكلمة مع الانتباه إلى الحروف الربطية
الملخص

تعتمد أنظمة معالجة الترابط المعيارية (coreference resolution) الحديثة على عدة استدعاءات لنماذج اللغة الكبيرة (LLM) لكل مستند، مما يجعلها باهظة التكلفة للغاية لعدد كبير من التطبيقات (مثل استخراج المعلومات من مجموعات بيانات ضخمة). وتحقيق النظام الرائد المبني على مستوى الكلمة (WL-coref) ما نسبته 96.6% من أداء هذه الأنظمة المتطورة، مع الحفاظ على كفاءة عالية جداً. في هذه الدراسة، نحدد حالة فشل شائعة ولكنها مهمة في نظام WL-coref: التعامل مع الإشارات المترابطة مثل "توم وماري". ونقدم حلّاً بسيطاً لكنه فعّالاً، يُحسّن الأداء على مجموعة اختبار OntoNotes بنسبة 0.9% في مؤشر F1، ويقلّص الفجوة بين حلول الترابط المبني على مستوى الكلمة الكفؤة والحلول المتطورة المكلفة بنسبة 34.6%. يتوفر نموذج الترابط المبني على مستوى الكلمة المُدرك للربط المترابط (CAW-coref) وشفرته المصدرية على الرابط التالي: https://github.com/KarelDO/wl-coref.