HyperAIHyperAI
Back to Headlines

ذكاء اصطناعي يتعلم أن يشك في نفسه ليحقق أداءً أذكى: كيف يُحدث "الشك الذاتي" ثورة في كفاءة النماذج اللغوية

منذ 8 أيام

تُظهر الدراسات الحديثة أن النماذج اللغوية الكبيرة (LLMs) أصبحت قادرة على حل مهام استدلال معقدة مثل مسائل أولمبياد الرياضيات أو الأسئلة العلمية، لكنها ما زالت مكلفة من حيث الحوسبة وتفتقر إلى الكفاءة أثناء الاختبار. لحل هذه المشكلة، طوّر باحثو ميتا آي تقنية جديدة تُسمى "ديب كونف" (DeepConf) أو "التفكير العميق مع الثقة"، التي تعتمد على تقييم مستوى ثقة النموذج في كل خطوة من خطوات التفكير، مما يسمح له بالاستغناء عن الحلول غير الموثوقة وتقليل الاستهلاك الحاسوبي بشكل كبير. في المقاربات التقليدية، يُولَّد مئات المسارات التفكيرية (مثل 512 مسارًا) لكل سؤال، ثم يُختار الجواب الأكثر تكرارًا عبر التصويت الجماعي (self-consistency). على معيار AIME 2025، يحقق نموذج Qwen3–8B دقة 68% في محاولة واحدة (pass@1)، لكنها ترتفع إلى 82% عند التصويت الجماعي على 512 مسارًا. لكن هذه الطريقة تستهلك ما يقارب 100 مليون رمز إضافي، ولا تضمن تحسنًا دائمًا، إذ قد تُضعف النتائج إذا تغلب الحلول العشوائية. لتحسين الكفاءة، استخدم الباحثون مؤشرات داخلية للثقة، مثل "الإنتروبي" و"المؤشرات الموثوقة" لكل رمز (token) خلال التوليد. عندما تكون احتمالات التنبؤ مرتفعة (أي منخفضة الإنتروبي)، يُعتبر النموذج متأكدًا من خطوته. بجمع هذه المؤشرات عبر المسار الكامل، يمكن تقدير "ثقة المسار" (trace confidence)، وحذف المسارات ذات الثقة المنخفضة قبل التصويت. تم تطوير "ديب كونف" كنظام ذكي يُطبّق هذه المبادئ في حالتين: "التفكير الخارجي" (Offline) و"التفكير المباشر" (Online). في الوضع الخارجي، تُولَّد جميع المسارات مسبقًا، ثم تُفرز حسب الثقة، ويُجرى التصويت على أفضل 10% من المسارات. أما في الوضع المباشر، فيُولَّد المسار خطوة بخطوة، ويُتوقف فورًا إذا انخفضت الثقة (مثلًا عند تجاوز حد معين في "الثقة الجماعية" أو "الثقة النهائية"). هذا يسمح بالتوقف المبكر، ويقلل من عدد الرموز المُولَّدة بنسبة تصل إلى 84.7% مقارنة بالطرق التقليدية. أظهرت النتائج تفوقًا ملحوظًا: على معيار AIME 2025، حقق نموذج GPT-OSS-120B باستخدام ديب كونف@512 دقة بلغت 99.9%، مقابل 97.0% في التصويت الجماعي التقليدي و91.8% في المحاولة الواحدة. هذه النتائج تُظهر أن التفكير المدروس، وليس المكثف، هو المفتاح. الخُلاصة: لا يكفي أن يكون النموذج ذكيًا، بل يجب أن يكون واعيًا بذاته. تقنية ديب كونف تُظهر كيف يمكن لـ"الشك" الذاتي أن يُحدث فرقًا كبيرًا — ليس فقط في الدقة، بل في الكفاءة. فهي تحول النموذج من كيان يُجبر على التفكير مرات عديدة، إلى مُحلِّل ذكي يختار بذكاء ما يستحق التفكير فيه. المستقبل ليس في الحوسبة المفرطة، بل في الذكاء المُوجَّه بالثقة.

Related Links