HyperAIHyperAI
منذ 2 أشهر

الاستدلال السريع والدقيق والمتنوع للتقسيم الدلالي للصورة باستخدام شبكات الارتباط الغاوسية العميقة

Siddhartha Chandra; Iasonas Kokkinos
الاستدلال السريع والدقيق والمتنوع للتقسيم الدلالي للصورة باستخدام شبكات الارتباط الغاوسية العميقة
الملخص

في هذا العمل، نقترح تقنية تنبؤ منظم تجمع فضائل حقول العشوائية الشرطية الجاوسية (G-CRF) مع التعلم العميق: (أ) مهمتنا في التنبؤ المنظم لها أقصى عالمي فريد يتم الحصول عليه بدقة من حل نظام خطي، (ب) متجهات الدرجات لمعلمات نموذجنا يتم حسابها تحليلياً باستخدام معادلات مغلقة، على عكس النماذج الحديثة للتنبؤ المنظم العميق التي تعتمد على الرجوع الخلفي عبر الزمن، (ج) المصطلحات الثنائية لدينا لا يجب أن تكون تعبيرات بسيطة مصممة يدوياً كما هو الحال في سلسلة الأعمال التي تستند إلى DenseCRF، بل يمكن "اكتشافها" من البيانات عبر هياكل عميقة، و(د) يمكن تدريب نظامنا بطريقة شاملة من البداية إلى النهاية. بناءً على الأدوات القياسية من التحليل العددي، طورنا خوارزميات فعالة للغاية للاستدلال والتعلم، بالإضافة إلى تقنية مخصصة تم تكييفها للمهمة الفصل الدلالي. هذه الكفاءة تتيح لنا استكشاف هياكل أكثر تعقيدًا للتنبؤ المنظم في التعلم العميق: نقدم هياكل متعددة الدقة لربط المعلومات عبر المراحل في إطار عمل الأمثلة المشتركة، مما يؤدي إلى تحسينات منهجية. نوضح فائدة نهجنا على معيار الفصل الصوري الصعب لـ VOC PASCAL 2012، حيث نظهر تحسينات كبيرة على خطوط الأساس القوية. نوفر جميع كودنا وتجاربنا في {https://github.com/siddharthachandra/gcrf}.

الاستدلال السريع والدقيق والمتنوع للتقسيم الدلالي للصورة باستخدام شبكات الارتباط الغاوسية العميقة | الأوراق البحثية | HyperAI