HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 10 أيام

PAN: نموذج عالمي للمحاكاة العامة والقابلة للتفاعل وعالية الطول الزمني للعالم

PAN: نموذج عالمي للمحاكاة العامة والقابلة للتفاعل وعالية الطول الزمني للعالم

الملخص

يُمكّن النموذج العالمي وكيلًا ذكيًا من التخيل والتوقع والاستنتاج حول كيفية تطور العالم استجابةً لإجراءاته، وبالتالي التخطيط والاستراتيجية. وعلى الرغم من أن نماذج إنشاء الفيديو الحديثة تُنتج تسلسلات بصرية واقعية، إلا أنها غالبًا ما تعمل بطريقة "النص المُدخل إلى الفيديو الكامل" دون التحكم السببي أو التفاعلية أو الاتساق على المدى الطويل، وهي مُتطلبات ضرورية للتفكير المقصود. من ناحية أخرى، تركز الجهود الحالية في بناء النماذج العالمية غالبًا على مجالات محدودة (مثل الديناميات الفيزيائية أو ألعاب الفيديو أو مشاهد ثلاثية الأبعاد) ذات عمق محدود وتحكم محدود، وتواجه صعوبة في التعميم عبر بيئات متنوعة وأساليب تفاعل مختلفة. في هذا العمل، نقدّم PAN، وهو نموذج عالمي عام، قابل للتفاعل، وطويل المدى، يُقدّر الحالات المستقبلية للعالم من خلال محاكاة فيديو عالية الجودة مشروطة بالتاريخ والإجراءات المكتوبة بلغة طبيعية. يستخدم PAN بنية التنبؤ اللاتيني التوليدي (GLP) التي تدمج بين هيكل ديناميكيات لاتينية ذاتية التوليد مبني على نموذج لغوي كبير (LLM)، والذي يُرتكز على معرفة مكتوبة واسعة النطاق ويُمكّن من التكيّف مع الإجراءات المحددة بلغة طبيعية، وبين مشفر فيديو تبديدي يعيد بناء ملاحظات بصرية دقيقة من حيث الإدراك ومتسلسلة زمنيًا، لتحقيق توحيد بين التفكير في الفضاء اللاتيني (الخيال) والديناميات القابلة للتحقيق في العالم الحقيقي (الواقع). تم تدريب PAN على أزواج فيديو-إجراء واسعة النطاق تمتد عبر مجالات متنوعة، مما يتيح له دعم المحاكاة المفتوحة المجال والمشروطة بالإجراءات، مع ديناميات متسقة وطويلة المدى. أظهرت التجارب الواسعة أداءً قويًا لـ PAN في محاكاة العالم المشروطة بالإجراءات، والتنبؤ على المدى الطويل، والتفكير التمثيلي مقارنةً بنماذج الفيديو الأخرى ونماذج العالم، ممّا يمثّل خطوة نحو نماذج عالمية عامة تُمكّن من محاكاة تنبؤية للحالات المستقبلية للعالم لغرض التفكير والفعل.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
PAN: نموذج عالمي للمحاكاة العامة والقابلة للتفاعل وعالية الطول الزمني للعالم | الأوراق البحثية | HyperAI