BTS-Net: شبكة نقل وتحديد ثنائية الاتجاه للكشف عن الكائنات البارزة في الصور الملونة وصور العمق

أثبتت المعلومات العميقة فائدتها في كشف الكائنات البارزة باستخدام الصور الملونة (RGB) والخريطة العميقة (D)، المعروفة بـ SOD. ومع ذلك، غالبًا ما تعاني الخرائط العميقة المستخرجة من جودة منخفضة ودقة غير دقيقة. تعاني معظم النماذج الحالية لـ RGB-D SOD من غياب التفاعلات بين الوسائط أو من وجود تفاعلات أحادية الاتجاه من الخريطة العميقة نحو الصور الملونة في مراحل الترميز (encoder)، مما قد يؤدي إلى ميزات ترميز غير دقيقة عند مواجهة خرائط عميقة ذات جودة منخفضة. ولحل هذه المشكلة، نقترح إجراء تفاعلات ثنائية الاتجاه متدرجة في مراحل الترميز مبكرًا، مما يُنتج شبكة جديدة تُسمى BTS-Net، والتي تعتمد على مجموعة من الوحدات ثنائية الاتجاه لنقل واختيار الميزات (BTS) لتنقية الميزات أثناء الترميز. وبالاعتماد على الميزات المُخرجة من الترميز القوي، نصمم أيضًا فكّاً خفيفًا وفعّالًا يعتمد على مجموعات (group decoder) لتحقيق تنبؤ دقيق بالكائنات البارزة في النهاية. وتشير التجارب الشاملة على ستة مجموعات بيانات شائعة الاستخدام إلى أن BTS-Net تتفوّق على 16 من أحدث النماذج المتميزة من حيث أربع مقاييس رئيسية.