باحثو NVIDIA يحققون فوزًا تاريخيًا في مسابقة تقييم الذكاء الاصطناعي العام
حقق باحثو NVIDIA إنجازًا بارزًا في مسابقة Kaggle ARC Prize 2025، التي يُنظر إليها على نطاق واسع كمقياس مباشر لتقدم الذكاء الاصطناعي نحو تحقيق الذكاء العام (AGI). تمكن فريق يُعرف باسم NVARC، ويتكون من إيفان سوروكن وجان-فرانسوا بوجيه، من المركز الأول على اللوحة العامة للمسابقة بتحصيل نسبة 27.64%، باستخدام نموذج مُعدّل بحجم 4 مليار معلمة، مُقيّمًا على نفس مجموعة البيانات المستخدمة في معيار ARC-AGI-2. وبعد انتهاء المسابقة، رفع الفريق أداءه إلى 29.72%، مع الحفاظ على كفاءة مالية متميزة: تكلفة تنفيذ كل مهمة لم تتجاوز 20 سنتًا. يُعد معيار ARC-AGI-2 من أصعب التحديات في مجال الذكاء الاصطناعي، حيث يقيس قدرة النماذج على التفكير المجرد وتمييز القواعد الخفية من عدد محدود جدًا من الأمثلة، عبر ألغاز بصرية مبنية على شبكات مصفوفات. وتم تصميمه لمقاومة الطرق المُختصرة مثل التخزين الذاكرة أو التعلّم من خلال التكرار، مما يجعله معيارًا دقيقًا لقياس القدرة الحقيقية على الاستدلال والتمييز. على عكس المعايير التقليدية التي تُقاس بحجم النموذج أو كمية البيانات، يُعد أداء النماذج على ARC-AGI-2 مؤشرًا موثوقًا على قدرة الذكاء الاصطناعي على التعلّم من "أقل قدر ممكن" — مهارة جوهرية في الذكاء العام. وتميّزت مسابقة Kaggle ARC Prize 2025 بكونها بيئة مفتوحة وقابلة للتكرار، تُجبر المشاركين على الابتكار ضمن قيود صارمة على الحوسبة والوقت. الحل الفائز من NVIDIA لم يعتمد على نماذج ضخمة أو عمليات بحث مكثفة. بل اعتمد على ثلاث مبادئ بسيطة لكنها قوية: بيانات مُصطنعة، تدريب أثناء التقييم (test-time training)، وهندسة دقيقة. إذ تم تجاوز قيود وقت التنفيذ في Kaggle من خلال نقل المعالجة المعقدة إلى مرحلة ما قبل التقييم، عبر بناء مجموعة بيانات اصطناعية متنوعة من الألغاز باستخدام تقنيات توليد مراحل متعددة، وتحليل المفاهيم، واستخدام نماذج مفتوحة المصدر متقدمة. النتيجة: نماذج صغيرة قادرة على التعرف على الأنماط وتعديل سلوكها بسرعة عند مواجهة لغز جديد، دون الحاجة إلى استكشاف كامل لمسار الحل. كما استخدم الفريق تقنية التدريب أثناء التقييم، التي تسمح للنموذج بتعلم خصائص كل لغز من خلال أمثلته القليلة، وهي تقنية أصبحت حجر الزاوية في الأداء الريادي في معايير ARC-AGI. لتحقيق هذا الأداء، اعتمد الفريق على أدوات NVIDIA NeMo، خصوصًا NeMo RL لدعم التعلم التكراري المُ-scalable، وNeMo Skills لتسهيل تدفق إنشاء البيانات الاصطناعية. هذا التكامل بين الأدوات والاستراتيجية المبتكرة يُظهر كيف يمكن تحقيق أداء فائق في التفكير التجريدي، حتى مع موارد محدودة. إن النتيجة ليست مجرد فوز في مسابقة، بل دليل عملي على أن الذكاء الاصطناعي قادر على التطور نحو التفكير العام بكفاءة وتكلفة منخفضة، عبر التفكير الاستراتيجي في التصميم، وليس فقط بالاعتماد على الحجم.
