HyperAIHyperAI

Command Palette

Search for a command to run...

إعادة النظر في قدرة النماذج اللغوية الكبيرة على التعميم التركيبي مع مراعاة قدرتها على اتباع التعليمات

Yusuke Sakai Hidetaka Kamigaito Taro Watanabe

الملخص

في مهام الاستدلال الشائع التوليدي مثل CommonGen، تقوم نماذج اللغة الكبيرة التوليدية (LLMs) بتكوين جمل تشمل جميع المفاهيم المعطاة. ومع ذلك، عند التركيز على قدرات اتباع التعليمات، إذا حددت الدعوة ترتيبًا معينًا للمفاهيم، يجب على نماذج اللغة الكبيرة إنشاء جمل تلتزم بالترتيب المحدد. لمعالجة هذا الأمر، نقترح Ordered CommonGen، وهو معيار مصمم لتقييم التعميم التوليدي والقدرة على اتباع التعليمات في نماذج اللغة الكبيرة. يقيس هذا المعيار التغطية المرتبة لتحديد ما إذا تم توليد المفاهيم بالترتيب المحدد، مما يسمح بتقييم متزامن لكلا القدرتين. أجرينا تحليلًا شاملًا باستخدام 36 نموذجًا للغة الكبيرة ووجدنا أن هذه النماذج فهمت بشكل عام نوايا التعليمات، ولكن الانحياز نحو أنماط معينة من ترتيب المفاهيم غالبًا ما يؤدي إلى إخراج منخفض التنوع أو نتائج متطابقة حتى عند تغيير ترتيب المفاهيم. علاوة على ذلك، حتى أكثر نماذج اللغة الكبيرة امتثالاً للتعليمات حققت فقط حوالي 75% من التغطية المرتبة، مما يؤكد الحاجة إلى تحسينات في كل من قدرات اتباع التعليمات والتعميم التوليدي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
إعادة النظر في قدرة النماذج اللغوية الكبيرة على التعميم التركيبي مع مراعاة قدرتها على اتباع التعليمات | مستندات | HyperAI