شبكات الحقول المتجهية المتكافئة للدوران

في العديد من مهام الرؤية الحاسوبية، نتوقع سلوكًا معينًا للناتج فيما يتعلق بدوران الصورة المدخلة. إذا تم ترميز هذه العلاقة بشكل صريح، بدلاً من التعامل معها كأي نوع آخر من التباين، فإن تعقيد المشكلة يقل، مما يؤدي إلى تقليل حجم النموذج المطلوب. في هذا البحث، نقترح شبكات الحقول المتجهية المعادلة للدوران (RotEqNet)، وهي بنية لشبكات العصبونات المتلافهة (CNN) تقوم بترميز المعادلة للدوران والثبات والترافق. يتم تطبيق كل مرشح متلافٍ في عدة اتجاهات ويعود بحقل متجهي يمثل قوة وزاوية الاتجاه الأعلى التقييم في كل موقع فضائي. نطور مشغل تلافيف معدل يعتمد على هذه التمثيلية للحصول على هياكل عميقة. نختبر RotEqNet على عدة مشاكل تتطلب استجابات مختلفة بالنسبة لدوران المدخلات: تصنيف الصور، وتقسيم الصور الطبية، وتقدير الاتجاه، ومطابقة القطع. في جميع الحالات، نظهر أن RotEqNet توفر نماذج شديدة الضغط من حيث عدد المعلمات وتقدم نتائج متناسقة مع تلك التي تقدمها الشبكات أكبر بمرات عديدة.