HyperAIHyperAI
منذ 11 أيام

SPIdepth: معلومات الوضع المُعززة للتقدير الذاتي للعمق من منظور واحد

Mykola Lavreniuk
SPIdepth: معلومات الوضع المُعززة للتقدير الذاتي للعمق من منظور واحد
الملخص

حصلت تقدير العمق من منظور واحد ذاتي التدريب على اهتمام كبير بفضل تطبيقاتها في القيادة الذاتية والروبوتات. وعلى الرغم من التقدم الذي أحرزته الطرق الحديثة في الاستفادة من تقنيات مثل طبقة الاستعلام الذاتي (SQL) لاستخلاص العمق من الحركة، فإنها غالبًا ما تتجاهل الإمكانات الكامنة في تعزيز المعلومات المتعلقة بالوضع (pose). في هذا البحث، نقدم طريقة جديدة تُدعى SPIdepth، التي تُركّز على تحسين شبكة الوضع لتحسين تقدير العمق. مستندةً إلى الأساس الذي وضعه SQL، تُبرز SPIdepth أهمية المعلومات المتعلقة بالوضع في التقاط الهياكل المفصلة للمناظر. وبتحسين قدرات شبكة الوضع، تحقق SPIdepth تقدمًا ملحوظًا في فهم المشهد وتقدير العمق. وقد أظهرت النتائج التجريبية على مجموعات بيانات معيارية مثل KITTI وCityscapes وMake3D أداءً متميزًا يتجاوز الطرق السابقة بفارق كبير. وبشكل خاص، تتصدر SPIdepth معيار KITTI ذاتي التدريب. كما حققت SPIdepth أقل قيم في معايير AbsRel (0.029)، وSqRel (0.069)، وRMSE (1.394) على KITTI، مما يُشكّل نتائج جديدة قياسية. وعلى مدينة Cityscapes، أظهرت SPIdepth تحسنًا بنسبة 21.7% في AbsRel، و36.8% في SqRel، و16.5% في RMSE مقارنة بـ SQLdepth، حتى دون استخدام أقنعة الحركة. وعلى مجموعة Make3D، تفوقت SPIdepth في السيناريو الصفر (zero-shot) على جميع النماذج الأخرى. وبشكل ملحوظ، حققت SPIdepth هذه النتائج باستخدام صورة واحدة فقط أثناء الاستنتاج، مما يفوق الطرق التي تستخدم تسلسلات فيديو للاستنتاج، ما يدل على كفاءتها وفعاليتها في التطبيقات الواقعية. تمثل هذه الطريقة تقدمًا كبيرًا في مجال تقدير العمق من منظور واحد ذاتي التدريب، وتشير إلى أهمية تعزيز المعلومات المتعلقة بالوضع لتحسين فهم المشهد في التطبيقات الواقعية. يُتاح الكود والنماذج المُدرّبة مسبقًا للجمهور عبر الرابط التالي: https://github.com/Lavreniuk/SPIdepth.

SPIdepth: معلومات الوضع المُعززة للتقدير الذاتي للعمق من منظور واحد | أحدث الأوراق البحثية | HyperAI