GoLLIE: توجيهات التسمية تحسن استخراج المعلومات بدون نماذج مسبقة

قد أحرزت نماذج اللغات الكبيرة (LLMs) المدمجة مع ضبط التعليمات تقدمًا كبيرًا في التعميم على المهام غير المعروفة سابقًا. ومع ذلك، كانت هذه النماذج أقل نجاحًا في استخراج المعلومات (IE)، حيث تخلفت عن النماذج الخاصة بالمهام. عادةً ما يتميز مهام استخراج المعلومات بقواعد تعليق معقدة تصف المهمة وتقدم أمثلة للبشر. فشلت المحاولات السابقة في الاستفادة من هذه المعلومات، حتى باستخدام أكبر النماذج، لأنها لم تستطع اتباع القواعد مباشرة. في هذا البحث، نقترح GoLLIE (نموذج اللغة الكبير الملتزم بالقواعد لاستخراج المعلومات)، وهو نموذج قادر على تحسين النتائج الأولية للمهام غير المعروفة في استخراج المعلومات من خلال التدريب الدقيق على الامتثال لقواعد التعليق. يظهر التقييم الشامل بشكل تجريبي أن GoLLIE قادر على التعميم واتباع القواعد غير المعروفة، مما يجعله يتفوق على المحاولات السابقة في استخراج المعلومات الأولية. يوضح دراسة الحذف أن القواعد التفصيلية هي العنصر الأساسي لتحقيق نتائج جيدة.