Command Palette
Search for a command to run...
شبكة انتباه متكررة متعددة المقياس تعتمد على العمق للكشف عن الجاذبية
شبكة انتباه متكررة متعددة المقياس تعتمد على العمق للكشف عن الجاذبية
Huchuan Lu Miao Zhang Jingjing Li Wei Ji Yongri Piao
الملخص
في هذه الدراسة، نقترح شبكة انتباه متكررة متعددة المقياس مُحفَّزة بالعمق للكشف عن الاهتمام البصري (saliency detection)، والتي تحقق أداءً ملحوظًا بشكل خاص في السيناريوهات المعقدة. وتتمثل ثلاث إسهامات رئيسية في شبكتنا، والتي تم تأكيدها تجريبيًا من حيث المزايا العملية المهمة. أولاً، نصمم كتلة تحسين فعّالة للعمق باستخدام روابط متكررة (residual connections) لاستخراج ودمج شامل لعلامات توجيهية متعددة المستويات ومكملة من تدفقات الصور الملونة (RGB) والتدفق العُمقي. ثانيًا، ندمج بشكل مبتكر إشارات العمق الغنية بالمعلومات المكانية مع ميزات السياق متعددة المقياس لتحديد موقع الكائنات المميزة بدقة. ثالثًا، نعزز أداء نموذجنا من خلال وحدة انتباه متكررة جديدة مستوحاة من الآلية التوليدية الداخلية للدماغ البشري، حيث يمكنها إنتاج نتائج انتباه أكثر دقة من خلال تعلُّم شامل للعلاقة المعنى الداخلية للسمات المدمجة، وتحسين تدريجي للتفاصيل المحلية عبر فهم سياقي مُوجَّه بالذاكرة. بالإضافة إلى ذلك، قمنا بإنشاء مجموعة بيانات RGB-D كبيرة الحجم تحتوي على سيناريوهات أكثر تعقيدًا، مما يُسهم في تقييم شامل لنموذج الكشف عن الاهتمام. وقد أظهرت التجارب الواسعة على ست مجموعات بيانات عامة، بما في ذلك مجموعتنا، أن طريقة التوصية لدينا قادرة على تحديد الكائنات المميزة بدقة، وتحقيق أداءً متفوّقًا باستمرار مقارنة بـ 16 من النماذج المتطورة في مجال الصور الملونة (RGB) والصور الملونة مع العمق (RGB-D).