HyperAI

برنامج تعليمي عبر الإنترنت: ابتكار نظام الذكاء الاصطناعي المادي، والبدء السريع في نموذج NVIDIA العالمي الأساسي، القادر على محاكاة ضوء الشمس والضباب

特色图像

في مؤتمر CES 2025 في أوائل يناير، جلب هوانغ رينكسون العديد من المفاجآت للجميع في سترة جلدية جديدة. بالإضافة إلى "أسرع وحدة معالجة رسومية في العالم RTX 5090"، فقد جذب الطراز الأساسي العالمي Cosmos أيضًا اهتمامًا واسع النطاق.

"الحدود التالية للذكاء الاصطناعي هي الفيزياء." استخدم هوانج كوزموس لشرح أصل ومصداقية تحليل هذا الاتجاه بشكل حدسي.

كما يوحي الاسم، فإن نموذج العالم قادر على إنشاء ومحاكاة عالم افتراضي، وبالتالي محاكاة العلاقات المكانية للأشياء في المشهد وتفاعلاتها المادية. خاصة،نموذج قاعدة عالم Cosmos عبارة عن مجموعة من نماذج المحولات الانتشارية والانحدارية المفتوحة لتوليد الفيديو المدرك للفيزياء.9 تريليون رمز تم تدريبها على 20 مليون ساعة من التفاعلات البشرية في العالم الحقيقي، والبيئات، والصناعة، والروبوتات، وبيانات القيادة.

أعطى كبير العلماء في شركة Nvidia جيم فان ملخصًا دقيقًا لبرنامج Cosmos على حسابه على مواقع التواصل الاجتماعي:

* يتوفر وضعين:أنماط الانتشار (العلامات المستمرة) وأنماط الانحدار الذاتي (العلامات المنفصلة)؛

* يدعم طريقتين للجيل:

نص إلى فيديو (نص->فيديو) ونص + فيديو إلى فيديو (نص + فيديو->فيديو)

من أجل تسهيل تجربة هذا النموذج الأساسي العالمي المبتكر للجميع، أطلق قسم البرامج التعليمية في الموقع الرسمي لشركة HyperAI "نشر نموذج Cosmos الأساسي العالمي بنقرة واحدة". يمكن للأصدقاء المهتمين الحضور وتجربته بأنفسهم ~

عنوان البرنامج التعليمي:

https://go.hyper.ai/GTCAL

تشغيل تجريبي

1. قم بتسجيل الدخول إلى hyper.ai، في صفحة البرنامج التعليمي، حدد نشر نموذج Cosmos World الأساسي بنقرة واحدة، ثم انقر فوق تشغيل هذا البرنامج التعليمي عبر الإنترنت.

2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

3. حدد قوة الحوسبة "NVIDIA RTX A6000" وصورة "PyTorch". يمكنك اختيار "الدفع حسب الاستخدام" أو "الباقة اليومية/الأسبوعية/الشهرية" وفقًا لاحتياجاتك، وأخيرًا انقر فوق "متابعة".

يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على 4 ساعات من RTX 4090 + 5 ساعات من وقت فراغ وحدة المعالجة المركزية!

رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):

https://openbayes.com/console/signup?r=Ada0322_QZy7

بالإضافة إلى ذلك، فإن حدث OpenBayes للعام الجديد جارٍ، ويتم تقديم حزم RTX 4090 وRTX A6000 ذات البطاقة الواحدة بنصف السعر لكل من اليوم والأسبوع!

4. انتظر حتى يتم تخصيص الموارد. تستغرق عملية الاستنساخ الأولى حوالي 7 دقائق. عندما تتغير الحالة إلى "قيد التشغيل"، انقر فوق "فتح مساحة العمل" وافتح "المحطة الطرفية".

5. أدخل الأمر التالي لتنشيط البيئة:

conda activate ./cosmos

6. أدخل الأمر التالي للتبديل إلى دليل Cosmos:

cd Cosmos

7. أدخل الأمر التالي لبدء واجهة نموذج التدرج:

PYTHONPATH=$(pwd) python cosmos1/models/diffusion/inference/gradio_text2world.py --checkpoint_dir checkpoints --diffusion_transformer_dir Cosmos-1.0-Diffusion-7B-Text2World --offload_prompt_upsampler --offload_text_encoder_model --offload_guardrail_models --video_save_name Cosmos-1.0-Diffusion-7B-Text2World --checkpoint_dir /input0

بعد ظهور المنفذ 8080، افتح عنوان API على اليمين للوصول إلى واجهة Gradio.

عرض التأثير

1. بعد الدخول إلى واجهة Gradio، أدخل كلمة المطالبة في "أدخل المطالبة" وانقر فوق "إرسال" لبدء الاستدلال. يمكنك رؤية الفيديو الناتج بعد الانتظار لبضع دقائق.

لقد قمت بإنشاء مقطع فيديو لمشهد طبيعي، والمطالبة أدناه للرجوع إليها.

الموضوع: في صباح أحد الأيام، أشرقت الشمس من خلال السحب في الجبال، وأضاءت البحيرة الهادئة. تتمتع البحيرة بمياه صافية وتحيط بها الغابات الخضراء المورقة. الجبال البعيدة مغطاة بالضباب، وبعض الطيور تحلق في السماء، والهواء نقي وهادئ وسلمي.

لقد قمنا بتأسيس "مجموعة تبادل الدروس حول الانتشار المستقر". نرحب بالأصدقاء للانضمام إلى المجموعة لمناقشة القضايا الفنية المختلفة ومشاركة نتائج التطبيق ~

قم بمسح رمز الاستجابة السريعة أدناه لإضافة HyperaiXingXing على WeChat (معرف WeChat: Hyperai01)، ولاحظ "SD Tutorial Exchange Group" للانضمام إلى الدردشة الجماعية.