منذ 3 أشهر
إلى فهم المشهد: تقدير عمق منفرد غير مراقب باستخدام تمثيل يراعي المعنى
{ Yu-Chiang Frank Wang, Yen-Cheng Liu, Alexander H. Liu, Po-Yi Chen}

الملخص
إن تقدير العمق من صورة واحدة يُعد مهمة صعبة في فهم المشهد، وتهدف إلى استخلاص الخصائص الهندسية للفضاء ثلاثي الأبعاد من صور ثنائية الأبعاد. وبسبب نقص أزواج الصور ذات الألوان (RGB) والعمق، تسعى الطرق غير المراقبة إلى استخلاص معلومات العمق باستخدام إشراف بديل مثل الأزواج الاستيريوية. ومع ذلك، فإن معظم الدراسات الحالية تفشل في نمذجة البنية الهندسية للأجسام، وهو ما ينشأ عادةً من اعتماد دوال هدف على مستوى البكسل أثناء التدريب. في هذه الورقة، نقترح نموذج SceneNet لتجاوز هذه القيود بمساعدة الفهم الدلالي الناتج عن تقسيم الصور. علاوةً على ذلك، يمكن لنموذجنا تنفيذ تقدير عمق واعٍ بالمنطقة من خلال فرض اتساق دلالي بين الأزواج الاستيريوية. وفي تجاربنا، نتحقق بشكل كمي ونوعي من فعالية ومتانة نموذجنا، حيث يُظهر نتائج مُرضية مقارنةً بالطرق الرائدة في المجال.