HyperAIHyperAI
منذ 4 أشهر

شبكات المفكك ثلاثي الإشراف للكشف المشترك والتقسيم

Jiale Cao; Yanwei Pang; Xuelong Li
شبكات المفكك ثلاثي الإشراف للكشف المشترك والتقسيم
الملخص

يمكن تطبيق الكشف المشترك عن الأشياء والتقسيم الدلالي على العديد من المجالات، مثل السيارات ذاتية القيادة والقوارب السطحية بدون طيار. وقد تم تحقيق تقدم أولي وهام في هذا الاتجاه من خلال مشاركة الميزات التلافيفية العميقة بين المهمتين. ومع ذلك، فإن هذه الخطة البسيطة غير قادرة على الاستفادة الكاملة من حقيقة أن الكشف والتقسيم يتعاضدان بشكل متبادل. لتجاوز هذا العيب، نقترح إطارًا نسميه TripleNet حيث يتم فرض ثلاثة أنواع من الإشراف على كل طبقة من طبقات شبكة الفكoder (الشبكة المنحلة)، وهي: الإشراف الموجه نحو الكشف، والإشراف الدلالي للتقسيم، والإشراف العام للتقسيم. يوفر الإشراف العام للتقسيم معرفة سابقة بوجود الأجسام لكل من التقسيم الدلالي والكشف عن الأشياء. بالإضافة إلى هذه الأنواع الثلاثة من الإشراف، يتم دمج وحدتين خفيفتي الوزن (أي الوحدة الداخلية المتصلة ووحدة الاندماج عبر الطبقات باستخدام تقنية الانتباه) في كل طبقة من طبقات الشبكة المنحلة. في الإطار المقترح، يمكن للكشف والتقسيم تعزيز بعضهما البعض بشكل كافٍ. علاوة على ذلك، لا يتم تنفيذ التقسيم العام والدلالي لكل طبقة من طبقات الشبكة المنحلة في مرحلة الاختبار. وبالتالي، لا يتم إدخال أي تكاليف حسابية إضافية في مرحلة الاختبار. تظهر النتائج التجريبية على مجموعتي البيانات VOC2007 وVOC2012 أن TripleNet المقترحة قادرة على تحسين دقة الكشف والتقسيم دون إضافة أي تكاليف حسابية إضافية.