HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

شبكات ConvNets متغيرة قابلة للتشويه السياقي لتحليل المشاهد الداخلية

{ Qi Wang Nianhui Guo Yuan Yuan Zhitong Xiong}

شبكات ConvNets متغيرة قابلة للتشويه السياقي لتحليل المشاهد الداخلية

الملخص

المعلومات السياقية حاسمة للفصل الدلالي للصور. وبالتحديد في المشاهد الداخلية، فإن التباين الكبير في أحجام الكائنات يجعل السياق المكاني عاملًا مهمًا لتحسين أداء الفصل. لذلك، في هذا البحث، نقترح وحدة جديدة تُسمى VCD (وحدة السياق المتغير المُنحني) لتعلم مجال الاستقبال التكيفي بطريقة منظمة. على عكس الشبكات العصبية التلافيفية القياسية التي تُستخدم نفس الحجم الثابت للسياق المكاني لجميع البكسلات، فإن وحدة VCD تتعلم سياقًا مكانيًا منحنيًا بمساعدة معلومات العمق: حيث توفر معلومات العمق مؤشرات لتحديد الجيران المحليين الحقيقيين. وبشكل خاص، يتم تعلم أنوية جاوسية تكيفية بمساعدة معلومات متعددة الأنواع. وبضرب الأنوية الجاوسية المُتعلمة بمرشحات التلافيف القياسية، يمكن لوحدة VCD جمع سياق مكاني مرن لكل بكسل أثناء عملية التلافيف. تتمثل المساهمات الرئيسية لهذا العمل في النقاط التالية: 1) اقتراح وحدة VCD الجديدة، التي تستغل أنوية جاوسية قابلة للتعلم لتمكين تعلم الميزات باستخدام سياق تكيفي منظم؛ 2) إدخال نمذجة احتمالية بايزيَّة متغيرة لتدريب وحدة VCD، مما يضمن استمرارية التدريب ويزيد من استقراره؛ 3) تصميم وحدة توجيه واعية بالمنظور للاستفادة من المعلومات متعددة الأنواع في فصل الصور RGB-D. وقد تم تقييم النهج المقترح على ثلاث مجموعات بيانات شائعة الاستخدام، وأظهرت النتائج تحسن الأداء فعالية الطريقة المقترحة.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
scene-parsing-on-cityscapes-testVCD No Coarse
mIoU: 82.3
semantic-segmentation-on-gamusVCD
mIoU: 59.70
semantic-segmentation-on-nyu-depth-v2VCD+RedNet (ResNet-50)
Mean IoU: 50.7%
semantic-segmentation-on-nyu-depth-v2VCD+ACNet (ResNet-50)
Mean IoU: 51.9%
semantic-segmentation-on-nyu-depth-v2VCD+DeepLab (VGG16)
Mean IoU: 45.3

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
شبكات ConvNets متغيرة قابلة للتشويه السياقي لتحليل المشاهد الداخلية | الأوراق البحثية | HyperAI