Command Palette
Search for a command to run...
OmniWorld: مجموعة بيانات متعددة المجالات ومتعددة الوسائط لنمذجة العالم الأربعة الأبعاد

الملخص
شهد مجال النمذجة العالمية الأربعة الأبعاد – والذي يهدف إلى التقاط الهندسة الفضائية والديناميات الزمنية بشكل مشترك – تقدماً ملحوظاً في السنوات الأخيرة، مدفوعاً بالتقدم المحرز في نماذج التوليد الضخمة والتعلم متعدد الوسائط. ومع ذلك، ما زال تطوير نماذج عالمية أربعة أبعاد حقيقية محدوداً جوهرياً بتوفر بيانات عالية الجودة. تفتقر المجموعات الحالية والاختبارات المعيارية إلى التعقيد الديناميكي، والتنوع المتعدد المجالات، والتعليقات الفضائية-الزمنية الضرورية لدعم مهام أساسية مثل إعادة بناء الهيكل الهندسي الأربعة الأبعاد، والتوقع المستقبلي، وإنشاء مقاطع فيديو بتحكم الكاميرا. ولسد هذه الفجوة، نقدم "أومني وورلد" (OmniWorld)، وهي مجموعة بيانات ضخمة، متعددة المجالات، متعددة الوسائط، مصممة خصيصاً لنمذجة العالم الأربعة الأبعاد. تتكوّن "أومني وورلد" من مجموعة بيانات جديدة تم جمعها تُسمى "أومني وورلد-غيم" (OmniWorld-Game)، بالإضافة إلى عدة مجموعات بيانات عامة مُختارة تغطي مجالات متنوعة. مقارنةً بالDatasets الاصطناعية الحالية، تقدم "أومني وورلد-غيم" تغطيةً أوسع للوسائط، وحجماً أكبر، وتفاعلات ديناميكية أكثر واقعية. وباستناد إلى هذه المجموعة، نُنشئ معياراً تحدياً يُبرز قيود الطرق الحالية الأفضل (SOTA) في نمذجة البيئات الأربعة الأبعاد المعقدة. علاوةً على ذلك، فإن عملية التخصيص الدقيق (fine-tuning) للطرق الحالية الأفضل على "أومني وورلد" تؤدي إلى تحسينات كبيرة في الأداء في مهام إعادة بناء العالم الأربعة الأبعاد وإنشاء مقاطع الفيديو، مما يؤكد بشكل قوي أن "أومني وورلد" تمثل مصدراً قوياً لتدريب وتقييم النماذج. نرى في "أومني وورلد" دافعاً لتسريع تطوير نماذج عالمية أربعة أبعاد عامة، مما يسهم في تطوير فهم شامل من قبل الآلات للعالم المادي.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.