NVIDIA Research Unveils Breakthroughs in Physical AI at SIGGRAPH
في مؤتمر SIGGRAPH في فانكوفر، كشفت NVIDIA Research عن تطورات حاسمة في مجال الذكاء الاصطناعي الفيزيائي (Physical AI)، الذي يُعدّ المحرك وراء الروبوتات الحديثة والسيارات ذاتية القيادة والمساحات الذكية. يعتمد هذا المجال على تكامل متقدم بين الرسوميات العصبية، وإنشاء بيانات اصطناعية، والمحاكاة الفيزيائية، والتعلم المعزز، والتفكير بالذكاء الاصطناعي، وهي مجالات تتمحور حول خبرات NVIDIA البحثية الممتدة على مدار عقدين. أبرز ما أُعلن خلال المؤتمر هو إطلاق مكتبات برمجية جديدة، منها Omniverse NuRec لتقنيات التمثيل ثلاثي الأبعاد باستخدام "البلاطات الغاوسية" (3D Gaussian splatting) لاستعادة عوالم ضخمة بدقة عالية، وتحديثات منصة Metropolis لذكاء البصريات، فضلاً عن نماذج Cosmos وNemotron، حيث تم تقديم Cosmos Reason، نموذج تفكير بصري لغوي يمكّن الروبوتات من التفكير كإنسان باستخدام المعرفة السابقة، والفهم الفيزيائي، والمنطق العام. تُعدّ بيئة افتراضية واقعية ودقيقة جوهر تطوير الذكاء الاصطناعي الفيزيائي، إذ لا يمكن تدريب الروبوتات على مهارات معقدة — مثل جمع البرتقال دون تلف أو تركيب مكونات إلكترونية دقيقة — إلا في بيئة محاكاة تُحاكي العالم الحقيقي بدقة. وفقًا لـمِنْغ-يُو لِيو، نائب رئيس البحث، فإن بناء هذه البيئات يتطلب دمجًا متقدمًا بين التصيير الفوري، ورؤية الحاسوب، ومحاكاة الحركة الفيزيائية، والذكاء الاصطناعي التوليدية ثنائي وثلاثي الأبعاد، وتحليل التفكير — وهي كلها مجالات استثمرت NVIDIA فيها لسنوات. تمتد خبرة NVIDIA في الرؤية الحاسوبية والتصيير الفوري إلى عام 2006، حيث ساهمت في تطوير تقنيات التتبع الشعاعي (ray tracing) والتصيير العصبي (neural rendering)، التي تُستخدم الآن لتحويل الصور والفيديوهات إلى بيئات ثلاثية الأبعاد دقيقة بسرعة. يوضح آرون ليفون، نائب رئيس أبحاث الرسوميات، أن الذكاء الاصطناعي يُسهم في بناء عوالم افتراضية من وسائط بسيطة، مثل صور الهواتف، مما يفتح الباب أمام تطوير محاكاة واقعية بسهولة. أبرز إنجازات البحث في المؤتمر تشمل ViPE (فيديو بوز إنغين)، أداة لتحليل الفيديو وتحديد حركة الكاميرا وبناء خرائط عمق دقيقة من تسجيلات غير احترافية، بالتعاون مع مختبر الرؤية الديناميكية وفريق NVIDIA Isaac. كما قدم فريق ليو في مختبر "الخيال العميق" نماذج توليدية قادرة على توقع سيناريوهات مستقبلية، مثل تصادم سيارة عند عبور إشارة حمراء أو سقوط كوب من حافة الطاولة. هذه الجهود تشكل الأساس لمنصة Cosmos، التي أُطلقت هذا العام لتوفير نماذج أساسية للعالم، وأدوات ما بعد التدريب، وآليات معالجة وتنقية البيانات بسرعة عالية، مما يُسرّع تطوير أدوات الذكاء الاصطناعي الفيزيائي. في مقالات المؤتمر، تناول الباحثون تحديًا جوهريًا: كيفية استخلاص هياكل ثلاثية الأبعاد واقعية من صور ثنائية الأبعاد، حيث تُظهر النماذج الحالية أحيانًا أشكالًا مرئية دقيقة لكنها غير مستقرة فعليًا. المنهجية الجديدة التي قدمتها NVIDIA تضمن أن تكون الأشكال المُولَّدة متوافقة مع القوانين الفيزيائية، مما يمنع تلف المحاكاة عند تطبيق قوى حقيقية. باختصار، تُظهر NVIDIA كيف أن التكامل بين الرسوميات والذكاء الاصطناعي يُحدث ثورة في بناء عوالم افتراضية دقيقة، تُستخدم لتدريب أنظمة ذكية تُنافس الواقع — مُشغّلة بمحركات بحثية متقدمة ورؤية مستقبلية لتحول الصناعة الرقمية.