HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 16 أيام

نقد: هل يمكن للاستعارة أن تساعد في تقويم عدم اليقين أو الثقة في نماذج لغة كبيرة؟

Qing Zong Jiayu Liu Tianshi Zheng Chunyang Li Baixuan Xu Haochen Shi Weiqi Wang Zhaowei Wang Chunkit Chan Yangqiu Song

نقد: هل يمكن للاستعارة أن تساعد في تقويم عدم اليقين أو الثقة في نماذج لغة كبيرة؟

الملخص

يُعدّ التمثيل الدقيق لدرجة الثقة في النماذج اللغوية الكبيرة (LLMs) أمراً بالغ الأهمية لاستخدامها بأمان في المجالات ذات الأبعاد الحاسمة، حيث يعزز التعبير الواضح عن الثقة بلغة طبيعية من ثقة المستخدم. تفشل الطرق التقليدية التي تحاكي تعبيرات الثقة المرجعية في غالب الأحيان في التقاط التفكير الضروري لتقييم دقيق لدرجة الثقة. ونُقدّم في هذا العمل نقداً لغوياً طبيعياً كحلٍ مناسبٍ جداً لتمثيل الثقة، نظراً لصعوبة الحصول على علامات ثقة مرجعية دقيقة، والتي تتطلب أحياناً توليداً متعدداً. يتناول هذا البحث كيف يمكن للاقتراحات اللغوية الطبيعية أن تُحسّن من التعبير عن الثقة، مع التطرق إلى: (1) ماذا نُقدّم للنقد: هل نُقدّم التردد (بتركيز على السؤال) أم نُقدّم الثقة (بتركيز على الإجابة)؟ تُظهر التحليلات أن الثقة تناسب المهام متعددة الخيارات، بينما يتفوّق التردد في السياقات المفتوحة. (2) كيف نُقدّم النقد: هل عبر النقد الذاتي أم عبر تدريب التمثيل بالنقاش؟ نقترح طريقة "النقد الذاتي" (Self-Critique)، التي تمكّن النماذج اللغوية الكبيرة من نقد نفسها وتحسين ثقتها بما يتجاوز مجرد الدقة، بالإضافة إلى طريقة "كريبتكال" (CriticCal)، وهي طريقة جديدة لتدريب التمثيل بالنقاش، تعتمد على النقد اللغوي الطبيعي لتحسين تمثيل الثقة، وتتجاوز التحسين العددي المباشر. تُظهر التجارب أن "كريبتكال" تتفوّق بشكل كبير على "النقد الذاتي" وعلى النماذج التنافسية الأخرى، حتى في بعض المهام المعقدة التي تفوق فيها نموذج المعلم GPT-4o. كما تُظهر "كريبتكال" قدرة عالية على التعميم في البيئات الخارجة عن التوزيع التدريبي، مما يُسهم في تعزيز موثوقية النماذج اللغوية الكبيرة.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
نقد: هل يمكن للاستعارة أن تساعد في تقويم عدم اليقين أو الثقة في نماذج لغة كبيرة؟ | الأوراق البحثية | HyperAI