اكتشاف الكائنات البارزة باستخدام التصوير ثلاثي الأبعاد والعمق من خلال الاندماج العميق

تم بذل جهود عديدة لتصميم م 큼ة مختلفة من المؤشرات البارزة على المستوى المنخفض للكشف عن البارزة في الصور ثلاثية الأبعاد الملونة (RGBD)، مثل خصائص التباين اللوني أو العمق، وأولويات الخلفية والكثافة اللونية. ومع ذلك، فإن كيفية تفاعل هذه المؤشرات البارزة مع بعضها البعض وكيفية دمج هذه المؤشرات البارزة على المستوى المنخفض بشكل فعال لإنتاج خريطة بارزة رئيسية لا تزال مشكلة صعبة. في هذا البحث، نصمم شبكة عصبية اتصالية جديدة (CNN) لدمج مؤشرات البارزة المختلفة على المستوى المنخفض إلى مميزات هرمية لاكتشاف الأجسام البارزة تلقائيًا في الصور ثلاثية الأبعاد الملونة (RGBD). بخلاف الأعمال الحالية التي تتغذى مباشرةً بالبيكسلات الخام للصورة إلى الشبكة العصبية الاصطلاحية، يعتمد الطريقة المقترحة على المعرفة الموجودة في الكشف التقليدي عن البارزة من خلال استخدام متجهات مميزات بارزة ذات معنى ومصممة بشكل جيد كمدخل. يمكن أن يوجه هذا التدريب للشبكة العصبية الاصطلاحية نحو اكتشاف الأجسام البارزة بشكل أكثر فعالية بسبب انخفاض الغموض في التعلم. ثم نقوم بدمج إطار عمل انتشار لابلاسي مع الشبكة العصبية المُتعلمة لاستخراج خريطة بارزة متسقة مكانياً من خلال استغلال البنية الذاتية للصورة المدخلة. أظهرت التقييمات التجريبية الكمية والنوعية الواسعة على ثلاثة قواعد بيانات أن الطريقة المقترحة تتفوق باستمرار على أفضل الأساليب الحالية.