علماء الذكاء الاصطناعي الرائدون يعملون على نموذج "عالمي" جديد يتجاوز حدود اللغة
باحثو الذكاء الصناعي الرائدون يقولون إن اللغة تحد من قدرات الذكاء الصناعي: إليكم الجيل الجديد من النماذج التي يعملون عليها في الوقت الذي تستثمر فيه شركات مثل OpenAI و Anthropic وشركات التكنولوجيا الكبرى مليارات الدولارات في تطوير نماذج اللغة الكبيرة (Large-Language Models)، يعمل مجموعة صغيرة من الباحثين في الذكاء الصناعي على проект جديد يهدف إلى تحقيق تقدم أكبر في هذا المجال. من بين هؤلاء الباحثين، نجد البروفيسورة في جامعة ستانفورد فاي-فاي لي، وهي رائدة في مجال البحث عن الذكاء الصناعي وملهمة مشروع ImageNet، والبروفيسور يان لوكون، كبير العلماء في الذكاء الصناعي في شركة Meta. ما هي النماذج العالمية؟ تختلف النماذج العالمية عن نماذج اللغة الكبيرة في أنها تتعلم وتتنبأ بالأحداث بناءً على التصورات العقلية التي يشكلها البشر عن العالم المحيط بهم، وليس فقط على العلاقات الإحصائية بين الكلمات والعبارات في بيانات التدريب. تقول فاي-فاي لي في حلقة حديثة منodcast a16z: "اللغة لا توجد في الطبيعة، فالبشر يعيشون ويقيمون الحضارة بما يتجاوز اللغة." تضيف أن البشر يستخدمون التصورات العقلية بطرق مستمرة في حياتهم اليومية وفي اتخاذ القرارات، مما يجعل هذه التصورات أساسية للسلوك البشري. سبب أهمية النماذج العالمية يشدد الباحثون على أن الذكاء الصناعي يجب أن يتمتع بقدرة مماثلة على تشكيل التصورات العقلية إذا كان يرغب في مجاراة أو تجاوز الذكاء البشري. تقدم فاي-فاي لي هذا المشروع من خلال World Labs، التي أسستها في عام 2024 بدعم أولي قدره 230 مليون دولار من شركات الاستثمار مثل Andreessen Horowitz و New Enterprise Associates و Radical Ventures. تهدف World Labs إلى رفع نماذج الذكاء الصناعي من مستوى البيانات ثنائية الأبعاد إلى عوالم ثلاثية الأبعاد افتراضية وحقيقية، مما يمنحها ذكاءً مكانيًا متكافئًا مع ذكاء الإنسان. تطبيقات النماذج العالمية تشير فاي-فاي لي إلى أن الذكاء المكاني هو "القدرة على فهم وتفسير التفاعل وإنشاء عوالم ثلاثية الأبعاد"، وذلك لأن العالم في جوهره ثلاثي الأبعاد. يمكن أن تُستخدم النماذج العالمية في مجالات متنوعة مثل الفن والإبداع والروبوتات، بالإضافة إلى التطبيقات العسكرية التي يمكن أن تساعد المحاربين على فهم بيئتهم وتوقع خطوات أعدائهم. التحديات أمام بناء النماذج العالمية من بين التحديات الرئيسية التي تواجه بناء النماذج العالمية هو نقص البيانات الكافية. بينما تم تطوير اللغة وتوثيقها على مدى قرون، فإن الذكاء المكاني يعتبر أقل تطورًا. توضح فاي-فاي لي أنه "إذا طُلب منك الآن إغلاق عينيك ورسم أو بناء نموذج ثلاثي الأبعاد للبيئة المحيطة بك، فلن يكون ذلك سهلاً." لذلك، يتطلب جمع البيانات اللازمة لهذه النماذج تقنيات بيانات أكثر تعقيدًا وتطورًا، بما في ذلك هندسة البيانات وجمعها ومعالجتها ودمجها. جهود يان لوكون في Meta في Meta، يدير يان لوكون فريقًا صغيرًا يعمل على مشروع مشابه. يستخدم الفريق بيانات الفيديو لتدريب النماذج ويقوم بتشغيل محاكاة تجرِّد الفيديوهات على مستويات مختلفة. قال لوكون في قمة AI Action في باريس هذا العام: "الفكرة الأساسية هي عدم التنبؤ على مستوى البيكسل. بل تدريب نظام يعمل على تمثيل مجرَّد للفيديو حتى يمكنه التنبؤ في هذا التمثيل المجرَّد، مع الأمل في أن هذا التمثيل سيحذف جميع التفاصيل التي لا يمكن التنبؤ بها." هذا يخلق مجموعة أبسط من لبنات البناء لرسم مسارات كيفية تغيير العالم في وقت معين. رؤية يان لوكون للمستقبل يعتقد يان لوكون أن هذه النماذج هي الطريقة الوحيدة لإنشاء ذكاء صناعي حقيقي. قال في جامعة سنغافورة الوطنية مؤخرًا: "نحتاج إلى أنظمة ذكاء صناعي قادرة على تعلم مهام جديدة بسرعة. يجب أن تفهم العالم الفيزيائي، وليس فقط النصوص واللغات، وأن تتمتع بمستوى من المنطق الشائع وقدرات التفكير والتخطيط، وأن تكون لديها ذاكرة ثابتة — كل هذه الصفات التي نتوقعها من الكيانات الذكية." تقييم الحدث من قبل المختصين يُعتبر هذا التوجه في البحث عن الذكاء الصناعي خطوة مهمة نحو تحقيق ذكاء صناعي أكثر تطورًا وقابلية للتطبيق في مجالات متنوعة. تشير المختصون إلى أن النماذج العالمية يمكن أن تفتح آفاقًا جديدة في مجال الروبوتات والذكاء الاصطناعي المكاني، مما يعزز قدراتها في التعامل مع بيئات معقدة ومتغيرة. نبذة عن World Labs تأسست World Labs في عام 2024 من قبل فاي-فاي لي، وهي شركة ملتزمة بتطوير نماذج الذكاء الصناعي التي تتجاوز اللغة إلى فهم العالم الثلاثي الأبعاد. حصلت الشركة على دعم مالي كبير من شركات الاستثمار الرائدة، مما يعكس الثقة في رؤيتها وتقنياتها المستقبلية.