HyperAIHyperAI
منذ 2 أشهر

شبكة توقع عدم اليقين الهندسي للكشف عن الأشياء ثلاثية الأبعاد من خلال الكاميرا أحادية العدسة

Lu, Yan ; Ma, Xinzhu ; Yang, Lei ; Zhang, Tianzhu ; Liu, Yating ; Chu, Qi ; Yan, Junjie ; Ouyang, Wanli
شبكة توقع عدم اليقين الهندسي للكشف عن الأشياء ثلاثية الأبعاد من خلال الكاميرا أحادية العدسة
الملخص

الإسقاط الهندسي هو طريقة قوية لتقدير العمق في اكتشاف الأشياء ثلاثية الأبعاد من خلال الكاميرا أحادية العدسة. يعتمد هذا الإسقاط على الارتفاعات، مما يدخل مقدمات رياضية في النموذج العميق. ومع ذلك، فإن عملية الإسقاط تؤدي أيضًا إلى مشكلة تضخيم الخطأ، حيث يتم تضخيم خطأ الارتفاع المقدر وعكسه بشكل كبير في العمق المخرج. هذه الخاصية تؤدي إلى استنتاجات عمق غير تحت السيطرة وتضر أيضًا بكفاءة التدريب. في هذا البحث، نقترح شبكة إسقاط عدم اليقين الهندسي (GUP Net) للتعامل مع مشكلة تضخيم الخطأ في مرحلتي الاستنتاج والتدريب. بصفة خاصة، تم اقتراح وحدة GUP للحصول على عدم اليقين الموجه هندسيًا للعمق المستنتج، مما لا يوفر فقط ثقة عالية وموثوقة لكل عمق بل يفيد أيضًا تعلم العمق. بالإضافة إلى ذلك، في مرحلة التدريب، نقترح استراتيجية التعلم متعدد المهام بطريقة هرمية لتقليل عدم الاستقرار الناجم عن تضخيم الخطأ. يقوم هذا الخوارزمية التعليم بمراقبة وضعية التعلم لكل مهمة من خلال مؤشر مقترح ويوزع بشكل متكيف أوزان الخسارة المناسبة لمختلف المهام بناءً على وضعية مهماتها السابقة. بناءً على ذلك، تبدأ كل مهمة في التعلم فقط عندما تكون مهماتها السابقة قد تم تعلمها جيدًا، مما يمكن أن يحسن بشكل كبير استقرار وكفاءة عملية التدريب. أظهرت التجارب الواسعة فعالية الطريقة المقترحة. يمكن للنموذج الشامل استنتاج عمق الأجسام بشكل أكثر موثوقية من الأساليب الموجودة ويتفوق على أفضل الكاشفات ثلاثية الأبعاد أحادية الصورة بنسبة 3.74% و4.7% AP40 لفئتي السيارات والمارة على معيار KITTI (KITTI benchmark).

شبكة توقع عدم اليقين الهندسي للكشف عن الأشياء ثلاثية الأبعاد من خلال الكاميرا أحادية العدسة | أحدث الأوراق البحثية | HyperAI