HyperAIHyperAI
منذ 2 أشهر

كسر سقف مجتمع النماذج اللغوية الكبيرة من خلال معالجة إنشاء الرموز كتصنيف للدمج

Yao-Ching Yu; Chun-Chih Kuo; Ziqi Ye; Yu-Cheng Chang; Yueh-Se Li
كسر سقف مجتمع النماذج اللغوية الكبيرة من خلال معالجة إنشاء الرموز كتصنيف للدمج
الملخص

تجميع النماذج المتعددة كان دائمًا نهجًا فعالًا لدفع حدود الأداء الحالي، ويُستخدم على نطاق واسع في مهام التصنيف من خلال متوسط متجهات احتمالات التصنيف من عدة تصنيفات لتحقيق دقة أفضل. ومع ذلك، في المجتمع المزدهر للنماذج اللغوية الكبيرة ذات المصدر المفتوح (LLM)، فإن طرق التجميع نادرة وغالبًا ما تقتصر على تجميع الإخراجات النصية الكاملة لهذه النماذج، مثل اختيار أفضل إخراج باستخدام مرتب، مما يؤدي إلى الاستخدام غير الكامل للمعلومات الاحتمالية على مستوى الرمز. في هذا البحث، نعالج عملية توليد كل رمز بواسطة النماذج اللغوية الكبيرة كمهمة تصنيف (GaC) للتجميع. يتيح هذا النهج استغلال المعلومات الاحتمالية بشكل كامل في كل خطوة من خطوات التوليد ويمنع بشكل أفضل ظهور أخطاء مبكرة في النماذج اللغوية الكبيرة التي قد تؤدي إلى أخطاء متراكمة. في التجارب، قمنا بتجميع نماذج LLM الأكثر تقدمًا حاليًا على عدة مقاييس، بما في ذلك الاختبارات والرياضيات والاستدلال، ولاحظنا أن طريقتنا تكسر سقف الأداء الحالي في المجتمع. بالإضافة إلى ذلك، لاحظنا أن معظم الرموز في الإجابة بسيطة ولا تؤثر على صحة الإجابة النهائية. لذلك، قمنا أيضًا بتجربة تجميع الرموز الرئيسية فقط، وأظهرت النتائج أداءً أفضل مع زمن استجابة أقل عبر جميع المقاييس.

كسر سقف مجتمع النماذج اللغوية الكبيرة من خلال معالجة إنشاء الرموز كتصنيف للدمج | أحدث الأوراق البحثية | HyperAI