لا يوجد أخ كبير أو أخ صغير: دمج المعرفة في النماذج اللغوية للتنبؤ بالروابط والإجابة على الأسئلة

يُعدّ دمج الرسوم المعرفية مع التعلم العميق أحد المجالات الناشئة بقوة في تحسين أداء مهام معالجة اللغة الطبيعية (NLP) المختلفة. في هذه الورقة، نركّز على توقع الروابط المدعومة بالمعرفة والإجابة على الأسئلة باستخدام نماذج اللغة T5 وBLOOM عبر ثلاث مجالات: الطيران، والأفلام، والويب. وفي هذا السياق، نُدخل المعرفة إلى نماذج لغة كبيرة وصغيرة، ونُحلّل أداؤها، ونلاحظ أن الأداء كان متشابهًا بين النموذجين. بالنسبة لمهام توقع الروابط في رسم معرفة الطيران، حصلنا على نتيجة 0.2 في مقياس hits@1 باستخدام نماذج T5-small وT5-base وT5-large وBLOOM. وباستخدام سكريبتات تعتمد على القوالب، أنشأنا مجموعة من مليون زوج من الأسئلة والجواب القائمة على حقائق (factoid QA) اصطناعية في مجال الطيران، مستمدة من تقارير هيئة السلامة الوطنية للنقل (NTSB). وعلى مجموعة الأسئلة والجواب التي قمنا بتنقيتها، حققت النماذج الثلاثة من T5 نتيجة 0.7 في مقياس hits@1. وتم التحقق من نتائجنا باستخدام اختبار t للطلاب المزدوج والمقاييس المعيارية لكوهين (Cohen's kappa). بالنسبة لمهام توقع الروابط في رسم معرفة الطيران باستخدام نموذج T5-small وT5-large، حصلنا على قيمة كوهين للكابا قدرها 0.76، ما يدل على توافق كبير بين النماذج. وبالتالي، نستنتج أن النماذج الصغيرة للغة تُظهر أداءً مشابهًا للنماذج الكبيرة عند دمجها بالمعرفة.