التاريخ

منذ 3 أشهر

الحجم

1.44 GB

الوسوم

توليد 3D

الترخيص

Other

GitHub

Tencent-Hunyuan/HunyuanWorld-Mirror

رابط الورقة البحثية

2510.10726

1. مقدمة البرنامج التعليمي

HunyuanWorld-Mirror هو نموذج مفتوح المصدر لتوليد عوالم ثلاثية الأبعاد، أطلقه فريق Hunyuan التابع لشركة Tencent في أكتوبر 2025. يدعم النموذج طرق إدخال متعددة، بما في ذلك الصور والفيديوهات متعددة المشاهد، ويُخرج نتائج تنبؤ هندسية ثلاثية الأبعاد متنوعة، مثل سحب النقاط وخرائط العمق ومعلمات الكاميرا. يعتمد النموذج على بنية تغذية أمامية خالصة، ويمكن تشغيله على وحدة معالجة رسومية واحدة، ويحقق استدلالًا من المستوى الثاني بمعالجة 8-32 مدخلًا محليًا. تشمل بنيته التقنية تلميحات مسبقة متعددة الوسائط، وبنية تنبؤ هندسية عامة، واستراتيجية تعلم متدرجة. من خلال آلية حقن مسبقة ديناميكية، يتكيف النموذج بمرونة مع أي توليفة من التلميحات المسبقة. أثناء التدريب، تُستخدم استراتيجية تعلم متدرجة تعتمد على ترتيب المهام وجدولة البيانات والحل التدريجي لزيادة قدرة التعميم إلى أقصى حد. يُظهر HunyuanWorld-Mirror أداءً ممتازًا في إعادة بناء سحب النقاط ثلاثية الأبعاد وإعادة بناء عوالم ثلاثية الأبعاد شاملة، مُبرزًا دقة هندسية فائقة وقدرات استعادة تفاصيل دقيقة. تتوفر أوراق بحثية ذات صلة. WorldMirror: إعادة بناء العالم ثلاثي الأبعاد العالمي مع أي مطالبة سابقة .

يستخدم هذا البرنامج التعليمي بطاقة رسوميات RTX 5090 واحدة كمورد افتراضي، ولكن يمكن استخدام بطاقة رسوميات RTX 4090 واحدة على الأقل لبدء البرنامج.

2. عرض التأثير

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة. تستغرق عملية إعادة البناء الأولى حوالي دقيقتين، وقد يستغرق تحميل البيانات وعرض التأثيرات ثلاثية الأبعاد بعض الوقت.

خيارات المعلمة:

فترة أخذ العينات من الفيديو: الفترة الفاصلة بين جلسات أخذ العينات من الفيديو.
خيارات إعادة البناء (غير مطبقة على 3DGS):
- إظهار الكاميرا: ما إذا كان سيتم عرض الكاميرا.
- إظهار الشبكة: ما إذا كان سيتم عرض الشبكة.
- تصفية الثقة المنخفضة وحواف العمق/العادية: ما إذا كان سيتم تصفية الثقة المنخفضة وحواف العمق/العادية.
- تصفية خلفية السماء: ما إذا كان سيتم تصفية خلفية السماء.
3D Gaussian Splatting: تصور تفاعلي لـ 3D Gaussian Splatting مع RGB وفيديو عميق (متاح للتنزيل بتنسيق PLY).
سحابة النقاط/الشبكة: سحابة النقاط.
خرائط العمق: نتائج تقدير العمق من خلال عرض واحد (يمكن تنزيلها بتنسيق PNG).
الخرائط العادية: تصور اتجاه السطح لكل عرض (يمكن تنزيلها بتنسيق PNG).
معلمات الكاميرا: وضع الكاميرا المقدر والمعلمات الجوهرية (يمكن تنزيلها بتنسيق JSON).

4. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@article{liu2025worldmirror,
  title={WorldMirror: Universal 3D World Reconstruction with Any-Prior Prompting},
  author={Liu, Yifan and Min, Zhiyuan and Wang, Zhenwei and Wu, Junta and Wang, Tengfei and Yuan, Yixuan and Luo, Yawei and Guo, Chunchao},
  journal={arXiv preprint arXiv:2510.10726},
  year={2025}
}

تم المساهمة في هذا الدفتر من قبل مستخدمي المجتمع وهو مخصص لأغراض تعليمية وإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

تشغيل هذا Notebook

التاريخ

منذ 3 أشهر

الحجم

1.44 GB

الوسوم

توليد 3D

الترخيص

Other

GitHub

Tencent-Hunyuan/HunyuanWorld-Mirror

رابط الورقة البحثية

2510.10726

1. مقدمة البرنامج التعليمي

يستخدم هذا البرنامج التعليمي بطاقة رسوميات RTX 5090 واحدة كمورد افتراضي، ولكن يمكن استخدام بطاقة رسوميات RTX 4090 واحدة على الأقل لبدء البرنامج.

2. عرض التأثير

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة. تستغرق عملية إعادة البناء الأولى حوالي دقيقتين، وقد يستغرق تحميل البيانات وعرض التأثيرات ثلاثية الأبعاد بعض الوقت.

خيارات المعلمة:

فترة أخذ العينات من الفيديو: الفترة الفاصلة بين جلسات أخذ العينات من الفيديو.
خيارات إعادة البناء (غير مطبقة على 3DGS):
- إظهار الكاميرا: ما إذا كان سيتم عرض الكاميرا.
- إظهار الشبكة: ما إذا كان سيتم عرض الشبكة.
- تصفية الثقة المنخفضة وحواف العمق/العادية: ما إذا كان سيتم تصفية الثقة المنخفضة وحواف العمق/العادية.
- تصفية خلفية السماء: ما إذا كان سيتم تصفية خلفية السماء.
3D Gaussian Splatting: تصور تفاعلي لـ 3D Gaussian Splatting مع RGB وفيديو عميق (متاح للتنزيل بتنسيق PLY).
سحابة النقاط/الشبكة: سحابة النقاط.
خرائط العمق: نتائج تقدير العمق من خلال عرض واحد (يمكن تنزيلها بتنسيق PNG).
الخرائط العادية: تصور اتجاه السطح لكل عرض (يمكن تنزيلها بتنسيق PNG).
معلمات الكاميرا: وضع الكاميرا المقدر والمعلمات الجوهرية (يمكن تنزيلها بتنسيق JSON).

4. المناقشة

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@article{liu2025worldmirror,
  title={WorldMirror: Universal 3D World Reconstruction with Any-Prior Prompting},
  author={Liu, Yifan and Min, Zhiyuan and Wang, Zhenwei and Wu, Junta and Wang, Tengfei and Yuan, Yixuan and Luo, Yawei and Guo, Chunchao},
  journal={arXiv preprint arXiv:2510.10726},
  year={2025}
}

HunyuanWorld-1.0: نموذج توليد عالم ثلاثي الأبعاد

منذ 9 أيام

العمق-أي-شيء-3: استعادة المساحة البصرية من أي منظور

منذ 2 أشهر

SAM3: نموذج التجزئة المرئية

منذ 2 أشهر

DiffVox: نموذج التمييز الصوتي

منذ 3 أشهر

Kiss3DGen: إطار عمل لتوليد الأصول ثلاثية الأبعاد يعتمد على نموذج انتشار الصور

منذ شهر واحد

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

منذ 3 أشهر

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

منذ 2 أشهر

ROCKET-2: لعبة ثلاثية الأبعاد Zero-Shot Transfer

منذ 2 أشهر

LongCat-Video: نموذج Meituan مفتوح المصدر لتوليد الفيديو بالذكاء الاصطناعي

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مرآة هونيوان العالمية: نموذج ثلاثي الأبعاد لجيل العالم

1. مقدمة البرنامج التعليمي

2. عرض التأثير

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

4. المناقشة

معلومات الاستشهاد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مرآة هونيوان العالمية: نموذج ثلاثي الأبعاد لجيل العالم

1. مقدمة البرنامج التعليمي

2. عرض التأثير

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

4. المناقشة

معلومات الاستشهاد

ذات صلة دفاتر تفاعلية

HunyuanWorld-1.0: نموذج توليد عالم ثلاثي الأبعاد

العمق-أي-شيء-3: استعادة المساحة البصرية من أي منظور

SAM3: نموذج التجزئة المرئية

DiffVox: نموذج التمييز الصوتي

Kiss3DGen: إطار عمل لتوليد الأصول ثلاثية الأبعاد يعتمد على نموذج انتشار الصور

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

ROCKET-2: لعبة ثلاثية الأبعاد Zero-Shot Transfer

LongCat-Video: نموذج Meituan مفتوح المصدر لتوليد الفيديو بالذكاء الاصطناعي

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مرآة هونيوان العالمية: نموذج ثلاثي الأبعاد لجيل العالم

1. مقدمة البرنامج التعليمي

2. عرض التأثير

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

4. المناقشة

معلومات الاستشهاد

ذات صلة دفاتر تفاعلية

HunyuanWorld-1.0: نموذج توليد عالم ثلاثي الأبعاد

العمق-أي-شيء-3: استعادة المساحة البصرية من أي منظور

SAM3: نموذج التجزئة المرئية

DiffVox: نموذج التمييز الصوتي

Kiss3DGen: إطار عمل لتوليد الأصول ثلاثية الأبعاد يعتمد على نموذج انتشار الصور

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

ROCKET-2: لعبة ثلاثية الأبعاد Zero-Shot Transfer

LongCat-Video: نموذج Meituan مفتوح المصدر لتوليد الفيديو بالذكاء الاصطناعي

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة دفاتر تفاعلية

HunyuanWorld-1.0: نموذج توليد عالم ثلاثي الأبعاد

العمق-أي-شيء-3: استعادة المساحة البصرية من أي منظور

SAM3: نموذج التجزئة المرئية

DiffVox: نموذج التمييز الصوتي

Kiss3DGen: إطار عمل لتوليد الأصول ثلاثية الأبعاد يعتمد على نموذج انتشار الصور

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

ROCKET-2: لعبة ثلاثية الأبعاد Zero-Shot Transfer

LongCat-Video: نموذج Meituan مفتوح المصدر لتوليد الفيديو بالذكاء الاصطناعي

ذات صلة دفاتر تفاعلية

HunyuanWorld-1.0: نموذج توليد عالم ثلاثي الأبعاد

العمق-أي-شيء-3: استعادة المساحة البصرية من أي منظور

SAM3: نموذج التجزئة المرئية

DiffVox: نموذج التمييز الصوتي

Kiss3DGen: إطار عمل لتوليد الأصول ثلاثية الأبعاد يعتمد على نموذج انتشار الصور

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

ROCKET-2: لعبة ثلاثية الأبعاد Zero-Shot Transfer

LongCat-Video: نموذج Meituan مفتوح المصدر لتوليد الفيديو بالذكاء الاصطناعي