HyperAIHyperAI
منذ 18 أيام

HEProto: نموذج مُحسَّن هيراركيًا يعتمد على بروتونيتي (ProtoNet) باستخدام التعلم متعدد المهام للتعرف على الكيانات الاسمية في حالات التدريب القليل

{Enhong Chen, Yi Zheng, Tong Xu, Pengfei Luo, Lili Zhao, Wei Chen}
الملخص

تمثّل مهمة التعرف على الكيانات الاسمية (NER) بعينات قليلة، التي تهدف إلى تحديد وتصنيف الكيانات من مجالات مختلفة باستخدام عينات تدريب محدودة، خطوة أساسية في بناء الرسوم المعرفية (KG). وقد بُذلت جهود كبيرة في هذا المجال لتحقيق أداء تنافسي، لكنها غالبًا ما تُعامل المهمتين الفرعيتين، وهما كشف النطاق (span detection) وتصنيف النوع (type classification)، على أنهما مستقلتان عن بعضهما البعض، مما أدى إلى إهمال التكامل والارتباط بين المهمتين. علاوة على ذلك، قد تفشل الأساليب السابقة في استيعاب الخصائص العامة (coarse-grained) للكيانات، ما يُنتج تمثيلًا شبهًا كافيًا من حيث المعنى بالنسبة لأنواع الكيانات. وللتصدي لهذا التحدي، نقترح في هذه الورقة نموذجًا يُسمى HEProto (Hierarchical Enhancing ProtoNet) مبنيًا على التعلم متعدد المهام، والذي يستخدم لتعلم المهمتين الفرعيتين معًا ونمذجة ارتباطهما. وبشكل محدد، نستخدم التعلم المُقابل (contrastive learning) لتعزيز معلومات حدود النطاق والتمثيلات الدلالية لأنواع الكيانات في المهمتين الفرعيتين. ثم نصمم شبكة بروتوبية هرمية (hierarchical prototypical network) لاستغلال المعلومات العامة للكيانات في مرحلة تصنيف النوع، مما يساعد النموذج على تعلُّم تمثيلات دلالية دقيقة (fine-grained) بشكل أفضل. وعلى هذا النهج، نُنشئ دالة خسارة للتمييز بالتشابه (similarity margin loss) لتقليل التشابه بين الكيانات الدقيقة والبروتوتيبات العامة غير ذات الصلة. وأخيرًا، أظهرت التجارب الواسعة على مجموعة بيانات Few-NERD أن حلنا يتفوّق على الطرق الأساسية التنافسية. يمكن الوصول إلى الشفرة المصدرية لـ HEProto من خلال الرابط: https://github.com/fanshu6hao/HEProto.

HEProto: نموذج مُحسَّن هيراركيًا يعتمد على بروتونيتي (ProtoNet) باستخدام التعلم متعدد المهام للتعرف على الكيانات الاسمية في حالات التدريب القليل | أحدث الأوراق البحثية | HyperAI