Command Palette
Search for a command to run...
ثق بنموذجك: معايرة الثقة الموجهة بالتوزيع
ثق بنموذجك: معايرة الثقة الموجهة بالتوزيع
Xizhong Yang Haotian Zhang Huiming Wang Mofei Song
الملخص
أظهرت نماذج الاستدلال الكبيرة (Large Reasoning Models) أداءً استثنائيًا بفضل تطور تقنيات التوسع أثناء زمن الاختبار (test-time scaling)، التي تعزز دقة التنبؤ من خلال توليد عدة استجابات مرشحة واختيار الإجابة الأكثر موثوقية. وفي حين أن الأعمال السابقة قد حللت أن الإشارات الداخلية للنموذج، مثل درجات الثقة، يمكن أن تشير جزئيًا إلى صحة الاستجابة وتظهر ارتباطًا توزيعيًا مع الدقة، فإن هذه المعلومات التوزيعية لم تُستغل بشكل كامل لإرشاد عملية اختيار الإجابة. استنادًا إلى ذلك، نقترح منهجية «DistriVoting» التي تدمج السوابق التوزيعية كإشارة إضافية إلى جانب درجة الثقة أثناء عملية التصويت. وتحديدًا، تقوم منهجيتنا بـ: (1) تفكيك توزيع الثقة المختلط إلى مركّبين إيجابيين وسالبين باستخدام نماذج الخلط الغاوسي (Gaussian Mixture Models)، ثم (2) تطبيق مرشح رفض (reject filter) مبني على العينات الإيجابية والسالبة المستخلصة من هذين المركّبين لتقليل التداخل بين التوزيعين. علاوة على ذلك، وللتخفيف الإضافي من التداخل من منظور التوزيع نفسه، نقترح منهجية «SelfStepConf» التي تستخدم درجة الثقة على مستوى الخطوة (step-level confidence) لضبط عملية الاستدلال ديناميكيًا، مما يزيد من الفصل بين التوزيعين ويحسن موثوقية درجات الثقة المستخدمة في التصويت. وتُظهر التجارب التي شملت 16 نموذجًا و5 معايير تقييم أن منهجيتنا تتفوق بشكل ملحوظ على أحدث المناهج المتاحة حاليًا.