مرآة هونيوان العالمية: نموذج ثلاثي الأبعاد لجيل العالم
1. مقدمة البرنامج التعليمي

مرآة HunyuanWorld-Mirror هو نموذج مفتوح المصدر لتوليد العالم ثلاثي الأبعاد، أصدره فريق Hunyuan التابع لشركة Tencent في أكتوبر 2025. يدعم هذا النموذج طرق إدخال متعددة، بما في ذلك الصور ومقاطع الفيديو متعددة المشاهد، ويمكنه إخراج نتائج تنبؤ هندسية ثلاثية الأبعاد متنوعة، مثل السحب النقطية وخرائط العمق ومعلمات الكاميرا. يعتمد النموذج على بنية تغذية أمامية نقية، ويمكن نشره على وحدة معالجة رسومات واحدة، ويحقق استدلالًا من المستوى الثاني من خلال معالجة 8-32 مدخل عرض محليًا. تتضمن بنيته التقنية تلميحات مسبقة متعددة الوسائط، وبنية تنبؤ هندسية عامة، واستراتيجية تعلم المنهج. من خلال آلية حقن مسبقة ديناميكية، يمكن للنموذج التكيف بمرونة مع أي مجموعة من التلميحات المسبقة. أثناء التدريب، تُستخدم استراتيجية تعلم المنهج القائمة على ترتيب المهام وجدولة البيانات والدقة التدريجية لتعظيم قدرة التعميم. يؤدي HunyuanWorld-Mirror أداءً ممتازًا في إعادة بناء السحابة النقطية ثلاثية الأبعاد وإعادة بناء 3DGS الشاملة، مما يُظهر دقة هندسية فائقة وقدرات استعادة التفاصيل. تتوفر أوراق بحثية ذات صلة على [رابط إلى الورقة ذات الصلة].WorldMirror: إعادة بناء العالم ثلاثي الأبعاد العالمي مع أي مطالبة سابقة".
يستخدم هذا البرنامج التعليمي بطاقة رسوميات RTX 5090 واحدة كمورد افتراضي، ولكن يمكن استخدام بطاقة رسوميات RTX 4090 واحدة على الأقل لبدء البرنامج.
2. عرض التأثير

3. خطوات التشغيل
1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة. تستغرق عملية إعادة البناء الأولى حوالي دقيقتين، وقد يستغرق تحميل البيانات وعرض التأثيرات ثلاثية الأبعاد بعض الوقت.

خيارات المعلمة:
- فترة أخذ العينات من الفيديو: الفترة الفاصلة بين جلسات أخذ العينات من الفيديو.
- خيارات إعادة البناء (غير مطبقة على 3DGS):
- إظهار الكاميرا: ما إذا كان سيتم عرض الكاميرا.
- إظهار الشبكة: ما إذا كان سيتم عرض الشبكة.
- تصفية الثقة المنخفضة وحواف العمق/العادية: ما إذا كان سيتم تصفية الثقة المنخفضة وحواف العمق/العادية.
- تصفية خلفية السماء: ما إذا كان سيتم تصفية خلفية السماء.
- 3D Gaussian Splatting: تصور تفاعلي لـ 3D Gaussian Splatting مع RGB وفيديو عميق (متاح للتنزيل بتنسيق PLY).
- سحابة النقاط/الشبكة: سحابة النقاط.
- خرائط العمق: نتائج تقدير العمق من خلال عرض واحد (يمكن تنزيلها بتنسيق PNG).
- الخرائط العادية: تصور اتجاه السطح لكل عرض (يمكن تنزيلها بتنسيق PNG).
- معلمات الكاميرا: وضع الكاميرا المقدر والمعلمات الجوهرية (يمكن تنزيلها بتنسيق JSON).
4. المناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@article{liu2025worldmirror,
title={WorldMirror: Universal 3D World Reconstruction with Any-Prior Prompting},
author={Liu, Yifan and Min, Zhiyuan and Wang, Zhenwei and Wu, Junta and Wang, Tengfei and Yuan, Yixuan and Luo, Yawei and Guo, Chunchao},
journal={arXiv preprint arXiv:2510.10726},
year={2025}
}بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.