HyperAIHyperAI
منذ 2 أشهر

NU-MCC: الترميز الضاغط متعدد الآراء مع مفكك الجوار والدالة غير المتجانسة المرتدة (Repulsive UDF)

Lionar, Stefan ; Xu, Xiangyu ; Lin, Min ; Lee, Gim Hee
NU-MCC: الترميز الضاغط متعدد الآراء مع مفكك الجوار والدالة غير المتجانسة المرتدة (Repulsive UDF)
الملخص

تم إحراز تقدم ملحوظ في إعادة بناء الصور ثلاثية الأبعاد من مدخلات RGB-D ذات المنظر الواحد. تعتبر طريقة MCC أحدث ما وصلت إليه التقنيات في هذا المجال، حيث حققت نجاحًا غير مسبوق بدمجها لمتحولات الرؤية مع التدريب على نطاق واسع. ومع ذلك، تم تحديد قيودين رئيسيين في طريقة MCC: 1) عدم كفاءة محول الفك (decoder) للمتحول في التعامل مع عدد كبير من نقاط الاستفسار؛ 2) صعوبة استعادة التفاصيل عالية الدقة في التمثيل الثلاثي الأبعاد. في هذه الورقة البحثية، نقترح نهجًا جديدًا يُسمى NU-MCC لمعالجة هذه القيود. يتضمن NU-MCC ابتكارين رئيسيين: محول فك الجوار (Neighborhood decoder) ودالة المسافة الغير الموقعة المقذوفة (Repulsive Unsigned Distance Function - Repulsive UDF). أولاً، يُقدّم محول فك الجوار لدينا نقاط مركزية كوسيلة وكيلة فعالة للخصائص البصرية المدخلة، مما يتيح لكل نقطة استفسار أن تتواصل فقط مع جوار صغير. هذا التصميم لا يؤدي فقط إلى زيادة سرعة الاستدلال بشكل كبير، بل يمكّن أيضًا من استخدام خصائص بصرية على نطاق أدق لتحسين استعادة النسيج الثلاثي الأبعاد. ثانيًا، تعد دالة المسافة الغير الموقعة المقذوفة لدينا بديلًا جديدًا لحقل الاشغال المستخدم في MCC، مما يحسّن بشكل كبير جودة إعادة بناء الأجسام ثلاثية الأبعاد. بالمقارنة مع دوال المسافة الغير الموقعة القياسية التي تعاني من ثقوب في النتائج، يمكن لدالة المسافة الغير الموقعة المقذوفة المقترحة لدينا تحقيق إعادة بناء سطح أكثر اكتمالاً. تظهر النتائج التجريبية أن NU-MCC قادر على تعلم تمثيل قوي ثلاثي الأبعاد، مما يحقق تقدمًا كبيرًا في مجال إعادة بناء الصور ثلاثية الأبعاد من منظر واحد. وبشكل خاص، يتميز NU-MCC بتفوّقه على MCC بنسبة 9.7% فيما يتعلق بمعيار F1 على مجموعة بيانات CO3D-v2 مع زيادة سرعة التشغيل بأكثر من 5 مرات.