التعرف على الكيانات المسماة عبر المجالات بدون موارد

النماذج الحالية للتعرف على الكيانات المسماة عبر المجالات (NER) تعتمد على العديد من الم corpuses غير المصنفة أو بيانات التدريب المصنفة لـ NER في المجالات المستهدفة. ومع ذلك، فإن جمع البيانات للمجالات المستهدفة ذات الموارد المنخفضة ليس فقط مكلفاً ولكنه أيضًا يستغرق وقتاً طويلاً. لذلك، نقترح نموذج NER عبر المجالات لا يستخدم أي موارد خارجية. أولاً، نقدم تعلم متعدد المهام (MTL) بإضافة دالة هدف جديدة للكشف عما إذا كانت الرموز هي كيانات مسماة أم لا. ثم، نقدم إطار عمل يُسمى خليط خبراء الكيانات (MoEE) لتحسين المتانة في التكيف بين المجالات دون موارد. وأخيراً، تظهر النتائج التجريبية أن نموذجنا يتفوق على النماذج القوية للتسمية التسلسلية عبر المجالات بدون إشراف، وأن أداء نموذجنا قريب من أداء النموذج الأكثر تقدماً الذي يستفيد من الموارد الواسعة.注:在阿拉伯语中,“corpus”(语料库)通常翻译为“المكتبة”或“المجموعة”,但在这里为了保持专业性和一致性,我选择了直接使用“corpuses”并将其解释为“الم corpuses”以指代多个语料库。如果需要更本地化的翻译,可以将“corpuses”替换为“المجموعات”。