الاسترجاع المُحَصَّن المُعَزَّز للتكوين لملء الفتحات دون تدريب مسبق

إحداث الرسوم البيانية للمعرفة ذات الجودة العالية تلقائيًا من مجموعة معينة من الوثائق لا يزال مشكلة صعبة في مجال الذكاء الاصطناعي. أحد الطرق لتسهيل حل هذه المشكلة هو التقدم في مهمة متعلقة تُعرف بـ "تعبئة الفتحات" (slot filling). في هذه المهمة، عند تقديم استعلام كيان على شكل [كيان، فتحة،؟]، يُطلب من النظام تعبئة الفتحة بإنتاج أو استخراج القيمة الناقصة باستخدام الأدلة المستخرجة من الفقرات ذات الصلة في المجموعة المعطاة من الوثائق. تعمل الأبحاث الحديثة في هذا المجال على حل هذه المهمة بطريقة شاملة باستخدام نماذج اللغة القائمة على الاسترجاع. في هذا البحث، نقدم طريقة جديدة لتعبئة الفتحات دون أي تعليمات سابقة (zero-shot) تمتد إلى الاسترجاع الكثيف للفقرات مع السلبيات الصعبة والإجراءات التدريبية المتينة لنماذج الإنتاج المعززة بالاسترجاع. يبلغ نموذجنا تحسينات كبيرة في كل من مجموعتي بيانات T-REx وzsRE لتعبئة الفتحات، مما يحسن كلًا من استرجاع الفقرات وإنتاج قيمة الفتحة، ويحتل المركز الأول في قائمة KILT. بالإضافة إلى ذلك، نظهر متانة نظامنا من خلال إظهار قدرته على التكيف بين المجالات على نسخة جديدة من مجموعة بيانات TACRED لتعبئة الفتحات، عبر مزيج من التعلم دون أي تعليمات سابقة / أو بقليل منها (zero/few-shot learning). نقوم بإصدار رمز المصدر والنماذج المدربة مسبقًا.