استخراج الثلاثي بدون تدريب مسبق من خلال التعبئة القالبية

يهدف مهمة استخراج الثلاثيات إلى استخراج أزواج الكيانات والعلاقات المقابلة لها من النص غير المنظم. تدرب معظم الطرق الحالية نموذج الاستخراج على بيانات تدريب تتضمن علاقات هدف محددة، ولا تستطيع استخراج علاقات جديدة لم يتم ملاحظتها أثناء التدريب. توسيع نطاق تعميم النموذج لتشمل العلاقات غير المرئية غالبًا ما يتطلب ضبط دقيق على بيانات التدريب الصناعية التي تكون غالبًا ضوضائية وغير موثوقة. نظهر أنه من خلال تقليص مهمة استخراج الثلاثيات إلى مهمة إكمال القوالب فوق نموذج لغوي مسبق التدريب (LM)، يمكننا تزويد نموذج الاستخراج بقدرات التعلم بدون أمثلة وحذف الحاجة إلى بيانات تدريب إضافية. نقترح إطارًا جديدًا، ZETT (استخراج الثلاثيات بدون أمثلة عن طريق إكمال القوالب) (ZEro-shot Triplet extraction by Template infilling)، يتناسب فيه هدف المهمة مع هدف التدريب المسبق للمتحولات الجينيراتيفية لتعميمها على العلاقات غير المرئية. أظهرت التجارب على قاعدتي البيانات FewRel و Wiki-ZSL أن ZETT تحقق أداءً ثابتًا ومتسقًا، وتتفوق على الطرق الرائدة سابقًا حتى عند استخدام القوالب المولدة تلقائيًا. https://github.com/megagonlabs/zett/