UnifiedQA: تجاوز حدود التنسيق باستخدام نظام واحد للأسئلة والأجوبة

تم طرح مهام الإجابة على الأسئلة (QA) باستخدام مجموعة متنوعة من التنسيقات، مثل اختيار النص المستخرج، والاختيار من متعدد، وغيرها. وقد أدى هذا إلى نماذج متخصصة في التنسيق، وحتى إلى تقسيم ضمني في مجتمع الإجابة على الأسئلة. نعتقد أن هذه الحدود هي صناعية وربما غير ضرورية، بالنظر إلى أن قدرات الاستدلال التي نسعى لتعليمها ليست محكومة بالتنسيق. كدليل على ذلك، استخدمنا أحدث التقدم في نمذجة اللغة لبناء نموذج إجابة على الأسئلة المُعد مسبقًا واحد، يُسمى UnifiedQA (يونيفايتد كيوه)، والذي يؤدي بشكل مفاجئ جيد عبر 17 مجموعة بيانات لإجابة الأسئلة تغطي 4 تنسيقات متنوعة. يحقق UnifiedQA (يونيفايتد كيوه) أداءً مكافئًا لنماذج 9 مختلفة تم تدريبها على مجموعات البيانات الفردية نفسها. حتى عند التعامل مع 12 مجموعة بيانات جديدة من التنسيقات الملاحظة، يؤدي UnifiedQA (يونيفايتد كيوه) بشكل مفاجئ جيد، مما يظهر قدرته القوية على التعميم من بيانات التدريب خارج التنسيق. وأخيرًا، مجرد تعديل هذا النموذج المُعد مسبقًا إلى نماذج متخصصة يؤدي إلى تحقيق مستوى جديد من الريادة في 6 مجموعات بيانات، مما يجعل UnifiedQA (يونيفايتد كيوه) نقطة انطلاق قوية لبناء أنظمة الإجابة على الأسئلة.