شبكة عصبية تقنية التعلم العميق المدركة للعمق لتقسيم الصور RGB-D

شبكات العصبونات التلافيفية (CNN) محدودة بسبب عدم قدرتها على التعامل مع المعلومات الهندسية نظرًا لهيكل النواة الشبكة الثابت. توفر بيانات العمق إمكانية التقدم في تقسيم المعنى للصور RGB-D باستخدام شبكات العصبونات التلافيفية. تستخدم الطرق الرائدة إما العمق كصور إضافية أو تعالج المعلومات المكانية في الحجوم ثلاثية الأبعاد أو السحب النقطية. تعاني هذه الطرق من تكلفة حسابية وذاكرة عالية. لحل هذه المشكلات، نقدم شبكات العصبونات التلافيفية الواعية بالعمق من خلال تقديم عمليتين بديويتين ومرونتين وفعالتين: التلفيف الواعي بالعمق والتوسيط الواعي بالعمق (depth-aware convolution and depth-aware average pooling). من خلال الاستفادة من تشابه العمق بين البكسلات أثناء عملية انتشار المعلومات، يتم دمج الهندسة بسلاسة في شبكة العصبونات التلافيفية. دون إدخال أي معلمات إضافية، يمكن دمج كلتا العمليتين بسهولة في شبكات العصبونات التلافيفية القائمة. تؤكد التجارب الواسعة والدراسات الاستبعادية على مقاييس تقسيم المعنى الصعبة للصور RGB-D فعالية ومرونة نهجنا.请注意,这里的“深度感知卷积”和“深度感知平均池化”被翻译为“التلفيف الواعي بالعمق”和“التوسيط الواعي بالعمق”,以保持专业性和准确性。同时,为了确保信息完整,括号内保留了英文术语。