HyperAIHyperAI
منذ 2 أشهر

شبكة الزراعة الهرمية للكشف عن البارزة بحلقة واحدة وبدقة عالية

Chenxi Xie; Changqun Xia; Mingcan Ma; Zhirui Zhao; Xiaowu Chen; Jia Li
شبكة الزراعة الهرمية للكشف عن البارزة بحلقة واحدة وبدقة عالية
الملخص

الطرق الحديثة للكشف عن الأشياء البارزة (SOD) المستندة إلى الشبكات العصبية العميقة حققت أداءً ملحوظًا. ومع ذلك، فإن معظم النماذج الحالية المصممة للصور ذات الدقة المنخفضة تؤدي بشكل سيء عند التعامل مع الصور ذات الدقة العالية بسبب التناقض بين عمق العينة وحجم المجال الاستقبالي. بهدف حل هذا التناقض، نقترح إطارًا جديدًا في مرحلة واحدة يُسمى شبكة الزراعة الهرمية (Pyramid Grafting Network - PGNet)، والتي تستخدم هيكلية الترانسفورمر والشبكة العصبية الم convoled (CNN) لاستخراج الخصائص من صور ذات دقات مختلفة بشكل مستقل، ثم زرع الخصائص من فرع الترانسفورمر إلى فرع CNN. كما تم اقتراح وحدة زراعة عبر النماذج القائمة على الانتباه (Cross-Model Grafting Module - CMGM) لتمكين فرع CNN من الجمع بين المعلومات التفصيلية المجزأة بشكل أكثر شمولية، بقيادة خصائص مختلفة خلال عملية فك التشفير. بالإضافة إلى ذلك، قمنا بتصميم خسارة موجهة بالانتباه (Attention Guided Loss - AGL) لمراقبة صراحة مصفوفة الانتباه التي ينتجها CMGM لمساعدة الشبكة على التفاعل بشكل أفضل مع الانتباه من نماذج مختلفة. نقدم مجموعة بيانات جديدة لكشف البارزات ذات الدقة الفائقة Ultra-High-Resolution Saliency Detection dataset (UHRSD)، تحتوي على 5,920 صورة بدقة تتراوح بين 4K و8K. حسب علم us، إنها أكبر مجموعة بيانات من حيث الكمية والدقة للمهمة الخاصة بكشف البارزات ذات الدقة العالية، والتي يمكن استخدامها في التدريب والاختبار في الأبحاث المستقبلية. أظهرت التجارب الكافية على UHRSD ومجموعات البيانات الشهيرة الأخرى لكشف البارزات أن طريقتنا تحقق أداءً أفضل مقارنة بالطرق الأكثر تقدمًا حاليًا.

شبكة الزراعة الهرمية للكشف عن البارزة بحلقة واحدة وبدقة عالية | أحدث الأوراق البحثية | HyperAI