اكتشاف الأشياء المموهة عبر الاندماج بين المستويات بوعي السياق

اكتشاف الأشياء المموهة (COD) يهدف إلى تحديد الأشياء التي تخفي نفسها في المشاهد الطبيعية. يعاني الاكتشاف الدقيق لـ COD من عدد من التحديات المرتبطة بضعف تباين الحدود والاختلاف الكبير في مظهر الأشياء، مثل حجم الشكل وشكلها. لمواجهة هذه التحديات، نقترح شبكة دمج مستويات السياق (C2F-Net) جديدة، والتي تقوم بدمج خصائص مستويات السياق للتحديد الدقيق للأجسام المموهة. بشكل خاص، نحسب معاملات الانتباه المعلوماتية من الخصائص متعددة المستويات باستخدام وحدة دمج مستويات الانتباه (ACFM) الخاصة بنا، والتي تقوم بعد ذلك بدمج الخصائص تحت إرشاد معاملات الانتباه. ثم نقترح وحدة سياق عالمي ثنائية الفروع (DGCM) لتحسين الخصائص المدمجة من خلال استغلال كميات كبيرة من المعلومات السياقية العالمية. يتم دمج العديد من الوحدات ACFM و DGCM بطريقة متسلسلة لإنتاج تنبؤ أولي من الخصائص عالية المستوى. يعمل هذا التنبؤ الأولي كخريطة انتباه لتحسين الخصائص المنخفضة المستوى قبل نقلها إلى وحدة الاستدلال المموه (CIM) لإنتاج التنبؤ النهائي. نقوم بأداء تجارب مكثفة على ثلاثة مجموعات بيانات مرجعية شائعة الاستخدام ونقارن C2F-Net مع النماذج الرائدة (SOTA). تظهر النتائج أن C2F-Net هو نموذج COD فعال ويتفوق بشكل كبير على النماذج الرائدة (SOTA). بالإضافة إلى ذلك، تم إجراء تقييم على مجموعات بيانات تقسيم البوليبات يوضح الإمكانات الواعدة لـ C2F-Net في التطبيقات الثانوية لـ COD. رمزنا البرمجي متاح للعموم على الرابط التالي: https://github.com/Ben57882/C2FNet-TSCVT.