HyperAIHyperAI
منذ 2 أشهر

فن تحسين نماذج اللغة الكبيرة: السؤال، التحسين، والثقة

Kumar Shridhar; Koustuv Sinha; Andrew Cohen; Tianlu Wang; Ping Yu; Ram Pasunuru; Mrinmaya Sachan; Jason Weston; Asli Celikyilmaz
فن تحسين نماذج اللغة الكبيرة: السؤال، التحسين، والثقة
الملخص

في السنوات الأخيرة، أظهرت النماذج اللغوية الكبيرة (LLMs) قدرات توليدية ملحوظة، ولكن هل يمكنها تقييم جودة إنتاجها الخاص؟ يشير مفهوم شائع يعرف بالتحسين الذاتي إلى أن هذه النماذج يمكنها اكتشاف وإصلاح الأخطاء في إنتاجها عند طلب ذلك منها. ومع ذلك، فإن الأدلة التجريبية الحديثة تشير في الاتجاه المعاكس، مما يقترح أن النماذج اللغوية الكبيرة غالبًا ما تجد صعوبة في تحديد الأخطاء بدقة عندما يكون التفكير متضمنًا. لمعالجة هذا الأمر، نقترح هدفًا للتفكير مع التحسين يُعرف بـ ART: سؤال، وتحسين، وثقة، والذي يقوم بطرح الأسئلة اللازمة لتحديد الوقت الذي يجب على النموذج اللغوي الكبير فيه تحسين إنتاجه، ويقرّ أو يمتنع عن الثقة في عملية التحسين من خلال تصنيف التحسين والتوقع الأولي. على مهمتين تتطلبان عدة خطوات من التفكير في المسائل الكلامية الرياضية (GSM8K) وفي الإجابة على الأسئلة (StrategyQA)، حقق ART زيادة في الأداء بمقدار +5 نقاط مقارنة بالأسس التقليدية للتحسين الذاتي، بينما يستخدم نموذجًا أصغر بكثير كصانع قرار. كما نوضح الفائدة من استخدام نماذج أصغر لصنع قرارات التحسين كبديل فعال من حيث التكلفة لتغليظ نموذج أكبر.

فن تحسين نماذج اللغة الكبيرة: السؤال، التحسين، والثقة | أحدث الأوراق البحثية | HyperAI