نمذجة ارتباطات التسمية لتصنيف الكيانات الدقيقة للغاية باستخدام الحقل العشوائي الشرطي الزوجي العصبي

يهدف التصنيف الكائنات الدقيقة جدًا (UFET) إلى توقع مجموعة واسعة من عبارات النوع التي تصف بدقة فئات ذكر الكائن في جملة معينة. تعتمد معظم الدراسات الحديثة على استنتاج كل نوع كائن بشكل مستقل، مما يتجاهل الارتباطات بين الأنواع، مثال على ذلك: عندما يُستنتج أن كائنًا ما هو رئيس، فيجب أن يكون أيضًا سياسيًا وقائدًا. ولتحقيق ذلك، نستخدم نموذجًا رسوميًا غير موجه يُسمى الحقل العشوائي الشرطي الزوجي (PCRF) لصياغة مشكلة UFET، حيث تتأثر متغيرات النوع ليس فقط بتأثيرات أحادية من المدخلات، بل أيضًا بعلاقة زوجية مع جميع متغيرات النوع الأخرى. نستخدم هياكل حديثة متعددة (backbones) لتصنيف الكائنات لحساب الاحتمالات الأحادية، ونستمد الاحتمالات الزوجية من تمثيلات عبارات النوع، والتي تلتقط المعلومات الدلالية السابقة وتساعد في تسريع عملية الاستنتاج. نستخدم استنتاج التباين المعياري (mean-field variational inference) لتحقيق استنتاج فعال لنوع الكائنات على مجموعات كبيرة جدًا من الأنواع، ونُعيد تشكيله كوحدة شبكة عصبية تُمكّن من التدريب من البداية إلى النهاية. أظهرت التجارب على UFET أن Neural-PCRF يتفوق باستمرار على هياكله الأساسية بتكاليف ضئيلة، ويحقق أداءً تنافسيًا مع أحدث النماذج القائمة على المُشِرِّع (cross-encoder) مع السرعة التي تفوقها بأكثر من ألف مرة. كما وجدنا أن Neural-PCRF فعّال أيضًا على مجموعة بيانات شائعة لتصنيف الكائنات الدقيقة ذات مجموعة صغيرة من الأنواع. وقد قمنا بتضمين Neural-PCRF كوحدة شبكة يمكن تركيبها بسهولة على تصنيفات متعددة الأنواع، ونُشرت في: https://github.com/modelscope/adaseq/tree/master/examples/NPCRF.