شبكات المفكك ثلاثي الإشراف للكشف المشترك والتقسيم

يمكن تطبيق الكشف المشترك عن الأشياء والتقسيم الدلالي على العديد من المجالات، مثل السيارات ذاتية القيادة والقوارب السطحية بدون طيار. وقد تم تحقيق تقدم أولي وهام في هذا الاتجاه من خلال مشاركة الميزات التلافيفية العميقة بين المهمتين. ومع ذلك، فإن هذه الخطة البسيطة غير قادرة على الاستفادة الكاملة من حقيقة أن الكشف والتقسيم يتعاضدان بشكل متبادل. لتجاوز هذا العيب، نقترح إطارًا نسميه TripleNet حيث يتم فرض ثلاثة أنواع من الإشراف على كل طبقة من طبقات شبكة الفكoder (الشبكة المنحلة)، وهي: الإشراف الموجه نحو الكشف، والإشراف الدلالي للتقسيم، والإشراف العام للتقسيم. يوفر الإشراف العام للتقسيم معرفة سابقة بوجود الأجسام لكل من التقسيم الدلالي والكشف عن الأشياء. بالإضافة إلى هذه الأنواع الثلاثة من الإشراف، يتم دمج وحدتين خفيفتي الوزن (أي الوحدة الداخلية المتصلة ووحدة الاندماج عبر الطبقات باستخدام تقنية الانتباه) في كل طبقة من طبقات الشبكة المنحلة. في الإطار المقترح، يمكن للكشف والتقسيم تعزيز بعضهما البعض بشكل كافٍ. علاوة على ذلك، لا يتم تنفيذ التقسيم العام والدلالي لكل طبقة من طبقات الشبكة المنحلة في مرحلة الاختبار. وبالتالي، لا يتم إدخال أي تكاليف حسابية إضافية في مرحلة الاختبار. تظهر النتائج التجريبية على مجموعتي البيانات VOC2007 وVOC2012 أن TripleNet المقترحة قادرة على تحسين دقة الكشف والتقسيم دون إضافة أي تكاليف حسابية إضافية.