التعلم الميتا المُجزَّأ للتصنيف التسلسلي للعينات القليلة

التسمية التسلسلية القليلة الأمثل (Few-shot sequence labeling) هي صيغة عامة للمشكلات في مهام فهم اللغة الطبيعية في السيناريوهات التي تعاني من نقص البيانات، حيث تتطلب النماذج التعميم على أنواع جديدة باستخدام فقط أمثلة مُعلَّمة قليلة. اعتمد التقدم الأخير بشكل رئيسي على التعلم التكراري القائم على المقاييس، مما يعرّضه للتحديات المتعلقة بتمثيل النموذج الأولي المتنوع (Other) وعجزه عن التعميم على الفئات ذات الفجوات الكبيرة في المجال. لتجاوز هذه التحديات، نقترح إطارًا مُفصَّلًا للتعلم التكراري للتسمية التسلسلية القليلة، والذي يُفكِّك المهمة إلى مهام التحديد القليلة الأمثل للذكر (few-shot mention detection) والتصنيف القليل الأمثل للنوع (few-shot type classification)، ويتعامل معها تسلسليًا من خلال التعلم التكراري. بشكل محدد، نستخدم التعلم التكراري المُعتمد على النموذج (MAML) لتحفيز نموذج تحديد الذكر على تعلُّم المعرفة المتعلقة بالحدود المشتركة بين الأنواع. وباستخدام النطاقات المحددة للذكر، نُكمل بعدها باستخدام شبكة النموذج الأولي على مستوى النطاق (span-level prototypical network) المُحسَّنة بواسطة MAML لإجراء التصنيف القليل الأمثل للنوع. بهذه الطريقة، يتجنب الإطار المُفصَّل متطلبات تمثيل النموذج الأولي المتنوع (Other). في الوقت نفسه، يمكّن استخدام خوارزمية MAML من استكشاف المعرفة المحتوية في الأمثلة الداعمة بشكل أكثر كفاءة، مما يتيح لنموذجنا التكيف السريع مع أنواع جديدة باستخدام عدد قليل جدًا من الأمثلة المُعلَّمة. ضمن هذا الإطار، نستعرض تنفيذًا أساسيًا يستخدم نموذجين منفصلين لكل مهمة فرعية. كما نقترح نموذجًا مُشتركًا لتقليل حجم النموذج ووقت الاستنتاج، مما يجعل إطارنا أكثر ملاءمة للسيناريوهات التي تفتقر إلى الموارد. أظهرت تجارب واسعة على تسع مجموعات بيانات معيارية، تشمل التعرف على الكيانات الاسمية، وتمييز الحقول (slot tagging)، وكشف الحوادث، وتمييز الأجزاء النحوية، أن النهج المقترح يحقق أداءً متفوقًا على مستوى الريادة في مختلف مهام التسمية التسلسلية القليلة الأمثل.