HyperAIHyperAI

Command Palette

Search for a command to run...

ثق بنموذجك: معايرة الثقة الموجهة بالتوزيع

Xizhong Yang Haotian Zhang Huiming Wang Mofei Song

الملخص

أظهرت نماذج الاستدلال الكبيرة (Large Reasoning Models) أداءً استثنائيًا بفضل تطور تقنيات التوسع أثناء زمن الاختبار (test-time scaling)، التي تعزز دقة التنبؤ من خلال توليد عدة استجابات مرشحة واختيار الإجابة الأكثر موثوقية. وفي حين أن الأعمال السابقة قد حللت أن الإشارات الداخلية للنموذج، مثل درجات الثقة، يمكن أن تشير جزئيًا إلى صحة الاستجابة وتظهر ارتباطًا توزيعيًا مع الدقة، فإن هذه المعلومات التوزيعية لم تُستغل بشكل كامل لإرشاد عملية اختيار الإجابة. استنادًا إلى ذلك، نقترح منهجية «DistriVoting» التي تدمج السوابق التوزيعية كإشارة إضافية إلى جانب درجة الثقة أثناء عملية التصويت. وتحديدًا، تقوم منهجيتنا بـ: (1) تفكيك توزيع الثقة المختلط إلى مركّبين إيجابيين وسالبين باستخدام نماذج الخلط الغاوسي (Gaussian Mixture Models)، ثم (2) تطبيق مرشح رفض (reject filter) مبني على العينات الإيجابية والسالبة المستخلصة من هذين المركّبين لتقليل التداخل بين التوزيعين. علاوة على ذلك، وللتخفيف الإضافي من التداخل من منظور التوزيع نفسه، نقترح منهجية «SelfStepConf» التي تستخدم درجة الثقة على مستوى الخطوة (step-level confidence) لضبط عملية الاستدلال ديناميكيًا، مما يزيد من الفصل بين التوزيعين ويحسن موثوقية درجات الثقة المستخدمة في التصويت. وتُظهر التجارب التي شملت 16 نموذجًا و5 معايير تقييم أن منهجيتنا تتفوق بشكل ملحوظ على أحدث المناهج المتاحة حاليًا.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp