Command Palette
Search for a command to run...
مرآة هونيوان العالمية: نموذج ثلاثي الأبعاد لجيل العالم
Date
Size
1.44 GB
Tags
License
Other
Paper URL
1. مقدمة البرنامج التعليمي

HunyuanWorld-Mirror هو نموذج مفتوح المصدر لتوليد عوالم ثلاثية الأبعاد، أطلقه فريق Hunyuan التابع لشركة Tencent في أكتوبر 2025. يدعم النموذج طرق إدخال متعددة، بما في ذلك الصور والفيديوهات متعددة المشاهد، ويُخرج نتائج تنبؤ هندسية ثلاثية الأبعاد متنوعة، مثل سحب النقاط وخرائط العمق ومعلمات الكاميرا. يعتمد النموذج على بنية تغذية أمامية خالصة، ويمكن تشغيله على وحدة معالجة رسومية واحدة، ويحقق استدلالًا من المستوى الثاني بمعالجة 8-32 مدخلًا محليًا. تشمل بنيته التقنية تلميحات مسبقة متعددة الوسائط، وبنية تنبؤ هندسية عامة، واستراتيجية تعلم متدرجة. من خلال آلية حقن مسبقة ديناميكية، يتكيف النموذج بمرونة مع أي توليفة من التلميحات المسبقة. أثناء التدريب، تُستخدم استراتيجية تعلم متدرجة تعتمد على ترتيب المهام وجدولة البيانات والحل التدريجي لزيادة قدرة التعميم إلى أقصى حد. يُظهر HunyuanWorld-Mirror أداءً ممتازًا في إعادة بناء سحب النقاط ثلاثية الأبعاد وإعادة بناء عوالم ثلاثية الأبعاد شاملة، مُبرزًا دقة هندسية فائقة وقدرات استعادة تفاصيل دقيقة. تتوفر أوراق بحثية ذات صلة. WorldMirror: إعادة بناء العالم ثلاثي الأبعاد العالمي مع أي مطالبة سابقة .
يستخدم هذا البرنامج التعليمي بطاقة رسوميات RTX 5090 واحدة كمورد افتراضي، ولكن يمكن استخدام بطاقة رسوميات RTX 4090 واحدة على الأقل لبدء البرنامج.
2. عرض التأثير

3. خطوات التشغيل
1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة. تستغرق عملية إعادة البناء الأولى حوالي دقيقتين، وقد يستغرق تحميل البيانات وعرض التأثيرات ثلاثية الأبعاد بعض الوقت.

خيارات المعلمة:
- فترة أخذ العينات من الفيديو: الفترة الفاصلة بين جلسات أخذ العينات من الفيديو.
- خيارات إعادة البناء (غير مطبقة على 3DGS):
- إظهار الكاميرا: ما إذا كان سيتم عرض الكاميرا.
- إظهار الشبكة: ما إذا كان سيتم عرض الشبكة.
- تصفية الثقة المنخفضة وحواف العمق/العادية: ما إذا كان سيتم تصفية الثقة المنخفضة وحواف العمق/العادية.
- تصفية خلفية السماء: ما إذا كان سيتم تصفية خلفية السماء.
- 3D Gaussian Splatting: تصور تفاعلي لـ 3D Gaussian Splatting مع RGB وفيديو عميق (متاح للتنزيل بتنسيق PLY).
- سحابة النقاط/الشبكة: سحابة النقاط.
- خرائط العمق: نتائج تقدير العمق من خلال عرض واحد (يمكن تنزيلها بتنسيق PNG).
- الخرائط العادية: تصور اتجاه السطح لكل عرض (يمكن تنزيلها بتنسيق PNG).
- معلمات الكاميرا: وضع الكاميرا المقدر والمعلمات الجوهرية (يمكن تنزيلها بتنسيق JSON).
4. المناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@article{liu2025worldmirror,
title={WorldMirror: Universal 3D World Reconstruction with Any-Prior Prompting},
author={Liu, Yifan and Min, Zhiyuan and Wang, Zhenwei and Wu, Junta and Wang, Tengfei and Yuan, Yixuan and Luo, Yawei and Guo, Chunchao},
journal={arXiv preprint arXiv:2510.10726},
year={2025}
}Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.