منذ 5 ساعات

الملخص

أظهرت نماذج الاستدلال الكبيرة (Large Reasoning Models) أداءً استثنائيًا بفضل تطور تقنيات التوسع أثناء زمن الاختبار (test-time scaling)، التي تعزز دقة التنبؤ من خلال توليد عدة استجابات مرشحة واختيار الإجابة الأكثر موثوقية. وفي حين أن الأعمال السابقة قد حللت أن الإشارات الداخلية للنموذج، مثل درجات الثقة، يمكن أن تشير جزئيًا إلى صحة الاستجابة وتظهر ارتباطًا توزيعيًا مع الدقة، فإن هذه المعلومات التوزيعية لم تُستغل بشكل كامل لإرشاد عملية اختيار الإجابة. استنادًا إلى ذلك، نقترح منهجية «DistriVoting» التي تدمج السوابق التوزيعية كإشارة إضافية إلى جانب درجة الثقة أثناء عملية التصويت. وتحديدًا، تقوم منهجيتنا بـ: (1) تفكيك توزيع الثقة المختلط إلى مركّبين إيجابيين وسالبين باستخدام نماذج الخلط الغاوسي (Gaussian Mixture Models)، ثم (2) تطبيق مرشح رفض (reject filter) مبني على العينات الإيجابية والسالبة المستخلصة من هذين المركّبين لتقليل التداخل بين التوزيعين. علاوة على ذلك، وللتخفيف الإضافي من التداخل من منظور التوزيع نفسه، نقترح منهجية «SelfStepConf» التي تستخدم درجة الثقة على مستوى الخطوة (step-level confidence) لضبط عملية الاستدلال ديناميكيًا، مما يزيد من الفصل بين التوزيعين ويحسن موثوقية درجات الثقة المستخدمة في التصويت. وتُظهر التجارب التي شملت 16 نموذجًا و5 معايير تقييم أن منهجيتنا تتفوق بشكل ملحوظ على أحدث المناهج المتاحة حاليًا.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار