HyperAIHyperAI
منذ 2 أشهر

استخراج الثلاثي بدون تدريب مسبق من خلال التعبئة القالبية

Bosung Kim; Hayate Iso; Nikita Bhutani; Estevam Hruschka; Ndapa Nakashole; Tom Mitchell
استخراج الثلاثي بدون تدريب مسبق من خلال التعبئة القالبية
الملخص

يهدف مهمة استخراج الثلاثيات إلى استخراج أزواج الكيانات والعلاقات المقابلة لها من النص غير المنظم. تدرب معظم الطرق الحالية نموذج الاستخراج على بيانات تدريب تتضمن علاقات هدف محددة، ولا تستطيع استخراج علاقات جديدة لم يتم ملاحظتها أثناء التدريب. توسيع نطاق تعميم النموذج لتشمل العلاقات غير المرئية غالبًا ما يتطلب ضبط دقيق على بيانات التدريب الصناعية التي تكون غالبًا ضوضائية وغير موثوقة. نظهر أنه من خلال تقليص مهمة استخراج الثلاثيات إلى مهمة إكمال القوالب فوق نموذج لغوي مسبق التدريب (LM)، يمكننا تزويد نموذج الاستخراج بقدرات التعلم بدون أمثلة وحذف الحاجة إلى بيانات تدريب إضافية. نقترح إطارًا جديدًا، ZETT (استخراج الثلاثيات بدون أمثلة عن طريق إكمال القوالب) (ZEro-shot Triplet extraction by Template infilling)، يتناسب فيه هدف المهمة مع هدف التدريب المسبق للمتحولات الجينيراتيفية لتعميمها على العلاقات غير المرئية. أظهرت التجارب على قاعدتي البيانات FewRel و Wiki-ZSL أن ZETT تحقق أداءً ثابتًا ومتسقًا، وتتفوق على الطرق الرائدة سابقًا حتى عند استخدام القوالب المولدة تلقائيًا. https://github.com/megagonlabs/zett/

استخراج الثلاثي بدون تدريب مسبق من خلال التعبئة القالبية | أحدث الأوراق البحثية | HyperAI