HyperAIHyperAI

Command Palette

Search for a command to run...

شبكة الزراعة الهرمية للكشف عن البارزة بحلقة واحدة وبدقة عالية

Chenxi Xie; Changqun Xia; Mingcan Ma; Zhirui Zhao; Xiaowu Chen; Jia Li

الملخص

الطرق الحديثة للكشف عن الأشياء البارزة (SOD) المستندة إلى الشبكات العصبية العميقة حققت أداءً ملحوظًا. ومع ذلك، فإن معظم النماذج الحالية المصممة للصور ذات الدقة المنخفضة تؤدي بشكل سيء عند التعامل مع الصور ذات الدقة العالية بسبب التناقض بين عمق العينة وحجم المجال الاستقبالي. بهدف حل هذا التناقض، نقترح إطارًا جديدًا في مرحلة واحدة يُسمى شبكة الزراعة الهرمية (Pyramid Grafting Network - PGNet)، والتي تستخدم هيكلية الترانسفورمر والشبكة العصبية الم convoled (CNN) لاستخراج الخصائص من صور ذات دقات مختلفة بشكل مستقل، ثم زرع الخصائص من فرع الترانسفورمر إلى فرع CNN. كما تم اقتراح وحدة زراعة عبر النماذج القائمة على الانتباه (Cross-Model Grafting Module - CMGM) لتمكين فرع CNN من الجمع بين المعلومات التفصيلية المجزأة بشكل أكثر شمولية، بقيادة خصائص مختلفة خلال عملية فك التشفير. بالإضافة إلى ذلك، قمنا بتصميم خسارة موجهة بالانتباه (Attention Guided Loss - AGL) لمراقبة صراحة مصفوفة الانتباه التي ينتجها CMGM لمساعدة الشبكة على التفاعل بشكل أفضل مع الانتباه من نماذج مختلفة. نقدم مجموعة بيانات جديدة لكشف البارزات ذات الدقة الفائقة Ultra-High-Resolution Saliency Detection dataset (UHRSD)، تحتوي على 5,920 صورة بدقة تتراوح بين 4K و8K. حسب علم us، إنها أكبر مجموعة بيانات من حيث الكمية والدقة للمهمة الخاصة بكشف البارزات ذات الدقة العالية، والتي يمكن استخدامها في التدريب والاختبار في الأبحاث المستقبلية. أظهرت التجارب الكافية على UHRSD ومجموعات البيانات الشهيرة الأخرى لكشف البارزات أن طريقتنا تحقق أداءً أفضل مقارنة بالطرق الأكثر تقدمًا حاليًا.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp