إطار تحليلي مُراعٍ للنوع للاعتراف بالكائنات المعرفية القليلة التدريب

رغم النجاح الأخير الذي حققته عدة شبكات بروتوباتية ثنائية المرحلة في مهمة التعرف على الكيانات الاسمية بكميات قليلة (NER)، تظل مشكلتان مُحَدِّدتَان: الكشف الزائد عن أجزاء خاطئة في مرحلة كشف الأجزاء، وعدم دقة وثبات البروتوبات في مرحلة تصنيف الأنواع. في هذه الورقة، نقترح إطارًا جديدًا يُسمى TadNER (نُوع-مُراعٍ-مُفكَّك)، يهدف إلى حل هاتين المشكلتين. نقدّم أولًا استراتيجية لتصفية الأجزاء المُراعية للنوع، تُستخدم لحذف الأجزاء الخاطئة من خلال إزالة تلك التي تبعد معنويًا عن أسماء الأنواع. ثم نقدّم استراتيجية تعلم تبايني مُراعية للنوع، تُستخدم لبناء بروتوبات أكثر دقة واستقرارًا من خلال الاستفادة المشتركة من عينات الدعم وأسماء الأنواع كمرجعية. أثبتت التجارب الواسعة على مجموعة متنوعة من المعايير أن الإطار المقترح TadNER يحقق أداءً جديدًا على مستوى الحالة الحالية. سيتم إتاحة الشيفرة والبيانات على الرابط: https://github.com/NLPWM-WHU/TadNER.