PromptNER: تحديد المحفزات وتصنيفها للاعتراف بالكيانات المسماة

التعلم بالحث هو نموذج جديد لاستخدام النماذج اللغوية المدربة مسبقًا وقد حقق نجاحًا كبيرًا في العديد من المهام. لتبني التعلم بالحث في مهمة تحديد الكيانات (NER)، تم استكشاف نوعين من الطرق من وجهتي نظر متوازيتين، وهما تعبئة القالب عن طريق تعداد الفواصل للتنبؤ بأنواع كياناتها أو بناء حث خاص بأنواع الكيانات لاكتشاف هذه الكيانات. ومع ذلك، فإن هذه الطرق ليس فقط تتطلب طريقة حث متعددة الأدوار مع تكلفة زمنية وحسابية عالية، بل تحتاج أيضًا إلى قوالب حث مفصلة، والتي تكون صعبة التطبيق في السيناريوهات العملية. في هذا البحث، نوحّد اكتشاف الكيانات وتصنيفها ضمن التعلم بالحث، ونصمم قالبًا متعدد الحوافز ذو فتحتين مزدوجتين: فتحة الموقع وفتحة النوع لتقديم الحث لاكتشاف الكيانات وتصنيفها على التوالي. يمكن إدخال عدة حوافز إلى النموذج في آن واحد، ثم يقوم النموذج باستخراج جميع الكيانات عبر التنبؤ المتوازي على الفتحات. لتعيين العلامات للفتحات أثناء التدريب، نصمم آلية تعبئة القالب الديناميكية التي تستفيد من تقابُل الرسم البياني Bipartite بين الحوافز والكيانات الحقيقية. أجرينا التجارب في مجموعة متنوعة من الإعدادات، بما في ذلك مجموعات البيانات الغنية بالمصادر والمجموعات المستوية والمتجانسة (flat and nested NER) ومجموعات البيانات ذات المصادر المنخفضة داخل المجال وعبر المجالات المختلفة (in-domain and cross-domain). أظهرت نتائج التجارب أن النموذج المقترح حقق تحسينًا أداءً كبيرًا، خاصةً في الإعداد القليل الصور عبر المجالات المختلفة (cross-domain few-shot setting)، حيث تفوق على أفضل النماذج الموجودة بمتوسط +7.7%.