استخراج المعلومات من الصفر كترجمة موحدة من النص إلى ثلاثيات

قمنا بتحويل مجموعة من مهام استخراج المعلومات إلى إطار عمل لتحويل النص إلى ثلاثيات. بدلًا من معالجة كل مهمة باستخدام مجموعات بيانات ونماذج مخصصة لكل مهمة، قمنا بصياغة المهمة كعملية ترجمة بين نص إدخال مخصص للمهمة وثلاثيات مخرجة. وباستخدام النص المخصص للمهمة كمدخل، نتمكن من إجراء ترجمة غير مخصصة للمهمة، وذلك من خلال الاستفادة من المعرفة الضمنية التي يمتلكها النموذج اللغوي المُدرّب مسبقًا حول المهمة. ونُظهر أيضًا أن مهمة التدريب البسيطة التي تتمثل في التنبؤ بـ"أي معلومة علاقة تتوافق مع أي نص إدخال" تمثل طريقة فعّالة لإنتاج مخرجات مخصصة للمهمة. هذا يمكّن من نقل الإطار إلى المهام التالية دون الحاجة إلى تدريب مخصص، أي نقل صفرية (zero-shot transfer). وقد درسنا أداء هذا الإطار في الوضع الصفرية على مهام استخراج المعلومات المفتوحة (OIE2016، NYT، WEB، PENN)، وتصنيف العلاقات (FewRel وTACRED)، والتحقيق الوصفي (Google-RE وT-REx). أظهر النموذج قدرة نقل غير بسيطة إلى معظم المهام، وغالبًا ما يكون منافسًا لأساليب التدريب الكامل المُراقبة دون الحاجة إلى أي تدريب مخصص للمهمة. على سبيل المثال، تفوقنا بشكل ملحوظ على معدّل F1 الخاص بالاستخراج المفتوح المُدرّب مسبقًا، دون الحاجة إلى استخدام مجموعة التدريب الخاصة به.