التعرف على الكيانات المحددة لربط الكيانات: ما الذي يعمل وما هو التالي

أحرزت أنظمة الربط الكائني (EL) نتائج مبهرة على المعايير القياسية القياسية، وذلك بشكل رئيسي بفضل التمثيلات السياقية التي توفرها النماذج اللغوية المُدرَّبة مسبقًا الحديثة. ومع ذلك، لا تزال هذه الأنظمة تتطلب كميات هائلة من البيانات – ملايين الأمثلة المُعلَّمة – للعمل بأقصى كفاءة، مع أوقات تدريب غالبًا ما تتجاوز عدة أيام، خاصةً عند توفر موارد حوسبة محدودة. في هذا البحث، نستعرض كيف يمكن استغلال التعرف على الكيانات الاسمية (NER) لتقليل الفجوة بين أنظمة EL المدربة على كميات عالية وكميات منخفضة من البيانات المُعلَّمة. وبشكل أكثر تحديدًا، نوضح كيف ولأي مدى يمكن لنموذج EL الاستفادة من NER لتحسين تمثيلاته الكائنية، وتعزيز اختيار المرشحين، واختيار أمثلة سلبية أكثر فعالية، وفرض قيود صارمة وناعمة على الكيانات الناتجة. ونُطلق برنامجنا – كود النموذج ونقط التحقق (checkpoints) – على الرابط التالي: https://github.com/Babelscape/ner4el.