HyperAIHyperAI
منذ 11 أيام

شبكة انتباه ثنائية الاتجاه للكشف عن الكائنات البارزة في الصور الملونة والعميقة

Zhao Zhang, Zheng Lin, Jun Xu, Wenda Jin, Shao-Ping Lu, Deng-Ping Fan
شبكة انتباه ثنائية الاتجاه للكشف عن الكائنات البارزة في الصور الملونة والعميقة
الملخص

تركز معظم الطرق الحالية للكشف عن الكائنات البارزة في الصور ذات الألوان الثلاثية (RGB-D) على المنطقة الأمامية عند استخدام الصور العمقية. ومع ذلك، فإن الخلفية توفر أيضًا معلومات مهمة في الطرق التقليدية للكشف عن الكائنات البارزة لتحقيق أداء متميز. ولاستكشاف المعلومات البارزة في كل من المناطق الأمامية والخلفية بشكل أفضل، نقترح في هذه الورقة شبكة انتباه ثنائية (BiANet) لمهام الكشف عن الكائنات البارزة في الصور RGB-D. وبشكل خاص، نُقدِّم وحدة انتباه ثنائية (BAM) تُعتمد على آلية انتباه متكاملة: انتباه أولي للمنطقة الأمامية (FF) وانتباه أولي للمنطقة الخلفية (BF). يركز الانتباه من النوع FF على المنطقة الأمامية بأسلوب تحسين تدريجي، بينما يُعيد الانتباه من النوع BF استرجاع معلومات بارزة محتملة مفيدة في المنطقة الخلفية. وبفضل وحدة BAM المقترحة، يمكن لشبكتنا BiANet التقاط إشارات أكثر معنى من كل من المنطقة الأمامية والخلفية، وتركيز انتباه أكبر على تحسين التفاصيل الغامضة الواقعة بين المنطقة الأمامية والخلفية. علاوةً على ذلك، نوسع وحدة BAM باستخدام تقنيات متعددة المقياس لتحسين الأداء في الكشف عن الكائنات البارزة. تُظهر التجارب الواسعة على ستة مجموعات بيانات معيارية أن BiANet تتفوق على الطرق الأخرى الرائدة في مجال الكشف عن الكائنات البارزة في الصور RGB-D من حيث مقاييس موضوعية ومقارنة بصرية ذاتية. ويمكن لـ BiANet العمل بسرعة تصل إلى 80 إطارًا في الثانية على صور RGB-D بحجم $224\times224$، باستخدام بطاقة NVIDIA GeForce RTX 2080Ti. كما تُثبت الدراسات التحليلية الشاملة تأثيرات المساهمات المقدمة في هذه الورقة.

شبكة انتباه ثنائية الاتجاه للكشف عن الكائنات البارزة في الصور الملونة والعميقة | أحدث الأوراق البحثية | HyperAI