التمييز الشائع للعناصر مع الاعتبارات العميقة للاحتضان باستخدام طبقتين متقاطعتين

فصل الأشياء المتشابكة بشكل كبير هو تحدي، لأن التمييز عادةً ما لا يتم بين محيطات الأشياء الحقيقية وحدود الإخفاء. على عكس طرق فصل النماذج الفردية ذات المرحلتين السابقة، نقوم بنمذجة تكوين الصورة كتركيب لطبقتين متشابكتين، ونقترح شبكة ثنائية الطبقات للتحويلات المتتالية (Bilayer Convolutional Network - BCNet)، حيث تقوم الطبقة العلوية من GCN بكشف الأشياء المخفيّة (الحاجب) والطبقة السفلية من GCN باستنتاج النماذج الجزئيّة المخفية (المخبأ). يفصل النمذجة الصريحة لعلاقة الإخفاء باستخدام البنية الثنائية حدود كلٍ من الأشياء الحاجبة والمخبأة بشكل طبيعي، ويأخذ في الاعتبار التفاعل بينهما أثناء تقدير القناع. نحن نتحقق من فعالية الفصل الثنائي على كاشفات الأشياء ذات المرحلة الواحدة والمرحلتين مع اختيارات مختلفة للأساس الخلفي ولطبقات الشبكة. رغم بساطتها، تظهر التجارب الواسعة على COCO و KINS أن شبكتنا BCNet التي تعي حساسية الإخفاء تحقق زيادة أداء كبيرة ومتسقة خاصة في الحالات التي يكون فيها الإخفاء شديدًا. يمكن الوصول إلى الكود في https://github.com/lkeab/BCNet.