HyperAIHyperAI

Command Palette

Search for a command to run...

النموذج اللغوي الكبير التالي قد لا يكون كبيرًا بعد كل شيء

في ظل التوجه السائد نحو تطوير نماذج لغوية ضخمة، تظهر أدلة متزايدة على أن الحجم لا يكفي لتحقيق تفكير حقيقي. فبينما اعتُبرت النماذج الكبيرة نتاجًا طبيعيًا للذكاء العام، أظهرت دراسات حديثة أن معظم هذه النماذج مُدرَّبة بشكل غير كافٍ، وتحتوي على عدد كبير جدًا من المعاملات دون فائدة حقيقية، ما يشير إلى أن الاعتماد على الحجم وحده ليس مسارًا فعّالًا. تُظهر النماذج الحالية، مثل تلك التي تعتمد على "السياق المتسلسل" (Chain-of-Thought)، أداءً محدودًا، حيث تُجبر على التفكير بصوت عالٍ خطوة بخطوة، ما يُنتج كمًّا هائلاً من "التوكنات" غير الضرورية، دون تفكير عميق أو إبداعي. كما أنها تعاني من عجز في التكيّف، إذ لا يمكنها تخصيص موارد حسابية إضافية للمسائل الصعبة، ما يُقلل من قدرتها على التفكير المُتعمق. لحل هذه المشاكل، تم تطوير نموذج جديد يُعرف بـ"النماذج الهرمية للتفكير" (Hierarchical Reasoning Models - HRM)، الذي يُعيد تصور طريقة تفكير النماذج. بدلًا من التفكير الصوتي المُرَتَّب، يُمكّن HRM النموذج من التفكير صامتًا وسريعًا داخل فضاءٍ مخفي (Latent Space) مُعقد، يشبه التفكير البشري الذي يبدأ بفكرة عميقة قبل التعبير عنها بالكلمات. يُبنى HRM على هيكل مزدوج: وحدة عالية المستوى (H-module) تُحدد الاستراتيجية العامة، ووحدة منخفضة المستوى (L-module) تُنفّذها بشكل متكرر. في مثال لحل متاهة 30×30، تبدأ الوحدة H بخطة عامة مثل "الاستكشاف نحو الأسفل واليمين"، ثم تُرسلها إلى الوحدة L التي تجرب المسارات، تعود عند الممرات المغلقة، وتُعيد المحاولة حتى تصل إلى نتيجة. بعد كل دورة، تُعاد تقييم الاستراتيجية بناءً على النتيجة، وتُعدّل الخطة للدورة التالية. الجديد في HRM هو آلية "الزمن الحسابي المتكيف" (Adaptive Computation Time - ACT)، التي تُعلّم النموذج متى يتوقف عن التفكير. تُقيّم النموذج احتمال دقة إجابته بعد كل دورة، وتحدد بذكاء ما إذا كان يجب الاستمرار أم التوقف. هذا يُمكّن النموذج من حل المسائل السهلة بسرعة، وتمديد التفكير عند صعوبة المهمة، دون استخدام موارد إضافية بشكل عشوائي. في الاختبارات، أظهر HRM أداءً متفوّقًا على النماذج الحالية في مهام مثل حل الألغاز الصعبة (Sudoku) والمتاهات الكبيرة، حيث نجح في إيجاد حلول صحيحة بينما فشلت النماذج الأخرى تمامًا. كما تفوق على نماذج ضخمة مثل o3-mini وClaude 3.7 في اختبار ARC-AGI، وهو معيار لقياس الذكاء السائل، رغم أن HRM يحتوي فقط على 27 مليون معامل، وتم تدريبه على 1000 نقطة بيانات فقط. الأهم، أن دقة HRM تزداد بشكل خطي مع زيادة الموارد الحسابية، في حين تُظهر النماذج التقليدية توقفًا مبكرًا في الأداء. هذا يدل على قدرة HRM على استغلال الحوسبة الإضافية بشكل فعّال، بخلاف النماذج الثابتة العمق. باختصار، HRM يُثبت أن التفكير الفعّال لا يكمن في الحجم، بل في التصميم الذكي. بدمج التفكير الهرمي، والقدرة على التكيّف الحسابي، وتمكين النموذج من "التأمل" بدل "الكلام"، يُقدّم نموذجًا يُعيد تعريف ما يعنيه "الذكاء" في عصر النماذج اللغوية.

الروابط ذات الصلة

النموذج اللغوي الكبير التالي قد لا يكون كبيرًا بعد كل شيء | القصص الشائعة | HyperAI