HyperAIHyperAI
منذ 16 أيام

AANet: شبكة تجميع تكيفية لتطابق ستيريو الفعّال

Haofei Xu, Juyong Zhang
AANet: شبكة تجميع تكيفية لتطابق ستيريو الفعّال
الملخص

رغم التقدم المذهل الذي أحرزه خوارزميات التوافق المستندة إلى التعلم، تبقى هناك تحديات رئيسية غير محلولة. تعتمد النماذج الحديثة الأفضل في مجال التوافق الثلاثي في معظمها على التحويلات الثلاثية الأبعاد المكلفة، حيث تجعل التعقيد الحسابي المتعدد الدرجات واستهلاك الذاكرة العالي التكلفة عاليًا جدًا لتطبيقها في التطبيقات الواقعية. في هذه الورقة، نهدف إلى استبدال التحويلات الثلاثية الأبعاد الشائعة تمامًا لضمان سرعة استنتاج عالية مع الحفاظ على دقة مماثلة. لتحقيق ذلك، نقترح أولًا طريقة لجمع التكلفة داخل المقياس تعتمد على نقاط نادرة لتخفيف المشكلة الشهيرة لتوسع الحواف عند انقطاعات التباين (disparity discontinuities). علاوة على ذلك، نقرب خوارزمية جمع التكلفة التقليدية عبر المقياس باستخدام طبقات الشبكة العصبية لمعالجة المناطق الكبيرة الخالية من النسيج. وتشكل هاتان الوظيفتان معًا مكونات بسيطة وخفيفة ومتوازنة، مما يؤدي إلى بنية فعالة وكفؤة لجمع التكلفة. وباستخدام هاتين الوظيفتين، يمكننا ليس فقط تسريع النماذج المتميزة الحالية بشكل كبير (مثل 41 مرة أسرع من GC-Net، و4 مرات أسرع من PSMNet، و38 مرة أسرع من GA-Net)، بل نُحسن أيضًا أداء النماذج السريعة للتوافق الثلاثي (مثل StereoNet). كما نحقق نتائج تنافسية على مجموعتي بيانات Scene Flow وKITTI مع تشغيل في زمن 62 مللي ثانية، مما يُظهر تنوعًا وفعالية عالية للطريقة المقترحة. يتوفر الإطار الكامل لدينا على الرابط التالي: https://github.com/haofeixu/aanet.

AANet: شبكة تجميع تكيفية لتطابق ستيريو الفعّال | أحدث الأوراق البحثية | HyperAI