UC-Net: اكتشاف الانتباه البصري الملونة والعميقة المُحفَّزة بالشك بمساعدة مُؤوِّرات التشفير التلقائي التبادلي الشرطي

في هذه الورقة، نقترح الإطار الأول (UCNet) الذي يستخدم عدم اليقين في الكشف عن الانتباه الملون (RGB-D) من خلال التعلم من عملية تسمية البيانات. تتعامل الطرق الحالية للكشف عن الانتباه الملون (RGB-D) بوصفها مشكلة تقدير نقطي، وتُنتج خريطة انتباه واحدة وفقًا لمسار تعلّم محدد. مستوحاة من عملية تسمية بيانات الانتباه، نقترح شبكة كشف انتباه ملون (RGB-D) احتمالية باستخدام مُعدّلات التشفير التلقائي الشريطي الشرطي (conditional variational autoencoders)، بهدف نمذجة عدم اليقين في التسمية البشرية، وإنتاج عدة خرائط انتباه لكل صورة مدخلة من خلال أخذ عينات من الفضاء الخفي. وباستخدام عملية التوافق في الانتباه المُقترحة، نتمكن من إنشاء خريطة انتباه دقيقة بناءً على هذه التنبؤات المتعددة. تُظهر التقييمات الكمية والكيفية على ستة مجموعات بيانات معيارية صعبة، مقارنةً بـ 18 خوارزمية منافسة، فعالية نهجنا في تعلّم توزيع خرائط الانتباه، مما يؤدي إلى تحقيق حالة جديدة من التميز في الكشف عن الانتباه الملون (RGB-D).