نموذج ذكاء اصطناعي يُدرّب نفسه على التفكير المنطقي دون تدخل بشري
أظهرت دراسة نُشرت في مجلة Nature عام 2025 أن نموذج الذكاء الاصطناعي "ديب سكي ر1" من شركة ديبي سكي آي، وهي شركة صينية متخصصة في الذكاء الاصطناعي، تمكن من تطوير مهارات التفكير المنطقي والحل التدريجي للمشكلات دون الحاجة إلى تدريب بشري مباشر. هذا التطور يمثل خطوة كبيرة نحو إنشاء نماذج ذكية قادرة على التفكير المستقل، بدلًا من اعتمادها على أمثلة مُعدة مسبقًا من البشر. في الماضي، كان تدريب النماذج على التفكير المنطقي يعتمد على تقديم آلاف الأمثلة التي تُظهر خطوات حل المشكلات، ما يجعل النموذج مُقيّدًا بجودة هذه الأمثلة ومحفوفًا بانحيازات بشرية. لكن فريق ديبي سكي استخدم تقنية تُسمى "التعلم بالتحفيز" (reinforcement learning)، حيث تم تشجيع النموذج على اكتشاف استراتيجيات الحل بنفسه، ببساطة من خلال مكافأة إجاباته الصحيحة في النهاية، دون توضيح الخطوات المطلوبة. خلال التدريب على مسائل رياضية ومعقدة في البرمجة والعلوم، بدأ النموذج في تطوير سلوكيات ذكية تشبه التفكير البشري، مثل التحقق من إجاباته، واستكشاف طرق مختلفة لحل المسألة، وحتى استخدام كلمات مثل "انتظر" أثناء تفكيره، مما يدل على تفاعل داخلي مع عملية التفكير. كلما وُجد مسار يؤدي إلى إجابة صحيحة، تم تعزيزه، بينما تم تجنب المسارات الخاطئة مع مرور الوقت. أظهر النموذج نتائج مذهلة، حيث حقق دقة بلغت 86.7% في مسابقة "أميريكان إيفيكيشينال ماثيماتيكس إكзамين" (AIME) 2024، وهي مسابقة صعبة تُعدّ تحديًا للطلاب المتفوقين في المدارس الثانوية الأمريكية. هذه النتيجة تفوقت على نماذج سابقة تم تدريبها باستخدام تدخل بشري مباشر. رغم النجاحات، لا يزال النموذج يواجه بعض التحديات، مثل الخلط بين اللغات عند تلقي أوامر غير إنجليزية، أو تعقيد الحلول البسيطة. لكن الباحثون يرون أن هذه المشكلات قابلة للحل، وأن نموذجًا قادرًا على التفكير والتعلم الذاتي يفتح الباب أمام جيل جديد من النماذج الذكية، أكثر كفاءة وقدرة، وقادرة على أداء مهام معقدة دون الحاجة إلى توجيه بشري مستمر. هذا التطور يُعدّ نقلة نوعية في مسيرة الذكاء الاصطناعي، نحو نماذج أكثر استقلالية وذكاءً حقيقيًا.
