تصميم بسيط قائم على التجميع للكشف الفوري عن الأشياء البارزة

نحل مشكلة كشف الأشياء البارزة من خلال دراسة كيفية توسيع دور التجميع في شبكات العصبونات المتكررة. بناءً على هندسة الشكل U، نقوم أولاً ببناء وحدة توجيه عالمية (GGM) على مسار القاع إلى القمة، بهدف توفير معلومات الموقع للأجسام البارزة المحتملة لطبقات مختلفة من الميزات. نصمم بعد ذلك وحدة تجميع الميزات (FAM) لدمج المعلومات الدلالية الخشنة بشكل جيد مع الميزات الدقيقة من مسار القمة إلى القاع. عن طريق إضافة وحدات FAM بعد عمليات التجميع في مسار القمة إلى القاع، يمكن دمج الميزات الخشنة من GGM بسلاسة مع الميزات بمختلف المقاييس. تسمح هاتان الوحدتان المستندتان إلى التجميع بتكرار تحسين الميزات الدلالية عالية المستوى، مما ينتج خرائط بروز غنية بالتفاصيل. تظهر نتائج التجارب أن النهج الذي اقترحناه يمكنه تحديد موقع الأجسام البارزة بدقة أكبر وبتفاصيل أكثر حدة، وبالتالي تحسين الأداء بشكل كبير مقارنة بأفضل الأساليب السابقة. كما أن نهجنا سريع ويمكنه العمل بسرعة تزيد عن 30 إطارًا في الثانية عند معالجة صورة بحجم $300 \times 400$. يمكن العثور على الكود في الرابط http://mmcheng.net/poolnet/.