العمق-أي-شيء-3: استعادة المساحة البصرية من أي منظور
1. مقدمة البرنامج التعليمي

يُعدّ Depth-Anything-3 (DA3) نموذجًا رائدًا للهندسة المرئية، وقد أصدره فريق ByteDance-Seed في نوفمبر 2025. وفيما يلي ورقة البحث ذات الصلة: العمق أي شيء 3: استعادة المساحة البصرية من أي وجهات نظر .
يُحدث هذا النموذج ثورةً في مهام الهندسة البصرية بفضل مفهوم "النمذجة المبسطة": فهو يستخدم مُحوِّلًا واحدًا عاديًا (مثل مُشفِّر DINO الأساسي) كشبكة أساسية، مُستبدلًا التعلّم المُعقّد متعدد المهام بـ"تمثيل شعاع العمق"، مما يُمكّنه من التنبؤ بالهياكل الهندسية المُتّسقة مكانيًا من أي مُدخلات بصرية (سواء كانت أوضاع الكاميرا معروفة أو غير معروفة). ويتفوّق أداؤه بشكلٍ ملحوظ على النماذج السابقة مثل DA2 (تقدير العمق أحادي الرؤية) والحلول المُشابهة مثل VGGT (تقدير العمق/الوضع متعدد المشاهد). جميع النماذج مُدرَّبة على مجموعات بيانات أكاديمية مُتاحة للعموم، مع مراعاة التوازن بين الدقة وقابلية التكرار.
الميزات الأساسية:
- التكامل متعدد المهام: يدعم نموذج واحد مهامًا مثل تقدير العمق أحادي الرؤية، ودمج العمق متعدد المشاهد، وتقدير وضع الكاميرا، وتوليد غاوسي ثلاثي الأبعاد.
- مخرجات عالية الدقة: تم تحقيق دقة عمق أحادية العين تبلغ 94.6% على مجموعة بيانات HiRoom؛ تتجاوز دقة إعادة بناء ETH3D نماذج مثل VGGT.
- التكيف متعدد النماذج: يوفر نماذج السلسلة الرئيسية (شاملة)، والقياسية (قياس العمق)، والأحادية (أحادية فقط)، والمتداخلة (دمج متداخل).
- تصدير مرن: يدعم تنسيقات مثل GLB و NPZ و PLY وفيديو 3DGS، ويتكامل بسلاسة مع أدوات ثلاثية الأبعاد اللاحقة (مثل Blender).
يستخدم هذا البرنامج التعليمي Grado لنشر نموذج DA3 الأساسي، مع موارد الحوسبة "RTX_5090"، والتي يمكنها تشغيل المهام الثقيلة بالكامل مثل توليد Gaussian ثلاثي الأبعاد (عالي الدقة) وإعادة بناء ثلاثية الأبعاد متعددة المشاهد دون أي اختناقات في ذاكرة الفيديو/الذاكرة.
2. عرض التأثير



يؤدي Depth-Anything-3 أداءً استثنائياً في المهام الأساسية:
- تقدير العمق أحادي العدسة: توليد خرائط عمق عالية الدقة من صورة RGB واحدة لإعادة بناء التسلسل الهرمي المكاني للمشهد.
- دمج العمق متعدد المشاهد: يقوم بإنشاء مجال عمق متسق بناءً على صور متعددة لنفس المشهد، مما يدعم إعادة بناء ثلاثية الأبعاد عالية الجودة.
- تقدير وضع الكاميرا: التنبؤ بدقة بالمعلمات الداخلية والخارجية للكاميرا (المعلمات الخارجية [N,3,4]، والمعلمات الداخلية [N,3,3])، والتكيف مع مهام التعاون متعددة المشاهد.
- توليد غاوسي ثلاثي الأبعاد: يقوم بإخراج نماذج غاوسية ثلاثية الأبعاد عالية الدقة مباشرة، ويدعم تركيب العرض الجديد (معدل الإطارات ≥ 30 إطارًا في الثانية).
- مخرجات قياس العمق: يمكن لنماذج السلسلة المتداخلة توليد عمق بمقياس واقعي، مما يلبي احتياجات المسح والتصميم الداخلي والسيناريوهات الأخرى.
3. خطوات التشغيل
1. ابدأ تشغيل الحاوية
بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. البدء
إذا ظهرت رسالة "Bad Gateway"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار من دقيقتين إلى ثلاث دقائق ثم تحديث الصفحة.


وصف المعلمة
- إعدادات معدل أخذ العينات
- معدل أخذ العينات (إطارات في الثانية): يتحكم في عدد الإطارات في الثانية المستخدمة لأخذ عينات الفيديو.
- إعداد معالجة الصور والاستدلال ثلاثي الأبعاد
- طريقة معالجة الصور: حدد وضع معالجة الصور لاستيعاب عدد أكبر من الصور.
- استنتاج التناثر الغاوسي ثلاثي الأبعاد: يتطلب تمكين استنتاج التناثر الغاوسي ثلاثي الأبعاد وقت معالجة إضافي لإنشاء نماذج ثلاثية الأبعاد.
- إعدادات مسار العرض وجودة الفيديو
- مسار العرض لوجهات نظر 3DGS: حدد نوع مسار العرض لوجهة نظر 3DGS.
- جودة الفيديو لمخرجات العرض ثلاثي الأبعاد: يتحكم في جودة الفيديو لمخرجات العرض ثلاثي الأبعاد.
- خيارات العرض المرئي
- عرض الكاميرا: يعرض مسار الكاميرا في عرض ثلاثي الأبعاد.
- تصفية الخلفية السوداء: تقوم هذه الخاصية بتصفية منطقة الخلفية السوداء في سحابة النقاط.
- تصفية الخلفية البيضاء: تقوم هذه الخاصية بتصفية مناطق الخلفية البيضاء في سحابة النقاط.
- نسبة التصفية: تتحكم في شدة تصفية سحابة النقاط.
- الحد الأقصى للنقاط (K نقطة): يحدد الحد الأقصى لعدد النقاط لتصدير نموذج ثلاثي الأبعاد بتنسيق GLB.
معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@article{depthanything3,
title={Depth Anything 3: Recovering the visual space from any views},
author={Haotong Lin and Sili Chen and Jun Hao Liew and Donny Y. Chen and Zhenyu Li and Guang Shi and Jiashi Feng and Bingyi Kang},
journal={arXiv preprint arXiv:2511.10647},
year={2025}
}
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.