HyperAIHyperAI
منذ 2 أشهر

تحليل المشاهد المتكررة مع فهم المنظور في الحلقة

Shu Kong; Charless Fowlkes
تحليل المشاهد المتكررة مع فهم المنظور في الحلقة
الملخص

قد تظهر الأشياء في صور المنظور لمشهد بمقاييس عشوائية، مما يشكل تحديًا لأنظمة التعرف التي تعالج الصور بدقة ثابتة. نقترح وحدة تحكم ذاتية الوعي بالعمق تقوم باختيار حجم مجال التجميع في بنية شبكة اتصالات تلافيفية بشكل متكيف مع مقاس الجسم (وهو عكسي النسبة إلى العمق) بحيث يتم الحفاظ على التفاصيل الصغيرة للأجسام البعيدة بينما يستخدم مجال استقبال أكبر لتلك القريبة. يتم توفير إشارة التحكم بالعمق من خلال الاختلاف الثنائي البؤرة أو تقديرها مباشرة من الإدخال الأحادي البؤرة. ندمج هذا التحكم الذاتي الوعي بالعمق في شبكة عصبية تلافيفية متكررة لأداء تقسيم الدلالة. يقوم وحدتنا المتكررة بتكرار تحسين نتائج التقسيم، مستفيدًا من التوقعات العميقة والدلالية من التكرارات السابقة.من خلال التجارب الواسعة على أربعة مجموعات بيانات كبيرة الحجم للصور ثنائية البؤرة، نثبت أن هذه الطريقة تحقق أداءً تنافسيًا في تقسيم الدلالة مع نموذج أكثر كثافة بكثير. نقوم بتحليل شامل لهذه البنية، بما في ذلك النسخ التي تعمل على الصور الأحادية البؤرة ثنائية الأبعاد ولكنها تستفيد من العمق كمعلومات جانبية أثناء التدريب، والتحكم غير المراقب ك آلية انتباه عامة، والتحكم متعدد الدقة. نجد أن التجميع المتحكم به للتقسيم الدلالي المشترك والعمق ينتج أفضل النتائج الكمية لتقدير العمق الأحادي البؤرة.