Command Palette
Search for a command to run...
SelfReformer: شبكة مُحسَّنة ذاتيًا باستخدام محول للكشف عن الكائنات البارزة
SelfReformer: شبكة مُحسَّنة ذاتيًا باستخدام محول للكشف عن الكائنات البارزة
Yi Ke Yun Weisi Lin
الملخص
تساهم السياقات العالمية والمكانية بشكل كبير في ضمان سلامة التنبؤات في مهمة اكتشاف الكائنات البارزة (SOD). ومع ذلك، ما زالت الطرق الحالية تعاني من صعوبة في إنتاج تنبؤات كاملة ودقيقة التفاصيل. توجد مشكلتان رئيسيتان في النهج التقليدي: أولاً، فيما يتعلق بالسياق العالمي، فإن ميزات المُشفِّر القائم على الشبكات العصبية التلافيفية ذات المستويات العالية (CNN) لا تستطيع التقاط الاعتماديات على مدى طويل بكفاءة، مما يؤدي إلى تنبؤات غير كاملة. ثانيًا، فإن عملية تقليل حجم البيانات الحقيقية (ground truth) لتتناسب مع حجم التنبؤات تؤدي إلى عدم دقة، نظرًا لفقدان التفاصيل الدقيقة أثناء عملية الاستيفاء أو التجميع (pooling). ولذلك، في هذا العمل، قمنا بتطوير شبكة قائمة على المُحوّل (Transformer) وصيغنا مهمة مراقبة لفرع معين لتعلم معلومات السياق العالمي بشكل صريح. علاوة على ذلك، استخدمنا تقنية "إعادة ترتيب البكسل" (Pixel Shuffle) المستمدة من تحسين الدقة (SR) لإعادة تشكيل التنبؤات إلى حجم البيانات الحقيقية، بدلًا من التحويل العكسي. وبهذا، تبقى التفاصيل الدقيقة في البيانات الحقيقية سليمة وغير متأثرة. بالإضافة إلى ذلك، طوّرنا وحدة تحسين السياق ذات مرحلتين (CRM) لدمج السياق العالمي وتحديد التفاصيل المكانية تلقائيًا وتحسينها في التنبؤات. تُمكن الشبكة المقترحة من التوجيه والتصحيح الذاتي بناءً على السياق العالمي والمكانية المُنتَجة، ولهذا أطلقنا عليها اسم "المُحوّل المُصَحَّح ذاتيًا" (SelfReformer). أظهرت التجارب الواسعة والنتائج التقييمية على خمسة مجموعات بيانات معيارية أداءً متميزًا للشبكة، وحققنا أفضل الأداء المُسجَّل حتى تاريخه.