InstructUIE: ضبط متعدد المهام لاستخراج المعلومات الموحد

قد أتاحت النماذج اللغوية الكبيرة قدرات متعددة المهام قوية من خلال قراءة التوجيهات التعليمية. ومع ذلك، أظهرت الدراسات الحديثة أن النماذج الحالية لا تزال تواجه صعوبات في مهام استخراج المعلومات. على سبيل المثال، حققت gpt-3.5-turbo درجة F1 بلغت 18.22 على مجموعة بيانات Ontonotes، وهي أقل بكثير من الأداء الرائد في هذا المجال. في هذه الورقة البحثية، نقترح InstructUIE، وهو إطار موحد لاستخراج المعلومات يستند إلى ضبط التوجيهات (instruction tuning)، يمكنه نمذجة مهام استخراج المعلومات المختلفة بشكل موحد وتقديم التقاط الارتباط بين المهام. لتأكيد صحة الطريقة المقترحة، نقدم IE INSTRUCTIONS، وهو مقاييس اختبار يحتوي على 32 مجموعة بيانات مختلفة لاستخراج المعلومات بتنسيق نصي موحد مع تعليمات كتبها خبراء. تظهر النتائج التجريبية أن طريقتنا تحقق أداءً مشابهًا لأداء Bert في الإعدادات الإشرافية ويتفوق بشكل كبير على الأداء الرائد وgpt3.5 في الإعدادات بدون إشراف (zero-shot).