التمييز الدلالي للصورة عبر شبكة التحليل العميقة

يتناول هذا البحث مشكلة تقسيم الصور الدلالي من خلال دمج معلومات غنية في حقل عشوائي ماركوفي (MRF)، بما في ذلك العلاقات من الرتب العليا ومزيج سياقات التسمية. على عكس الأعمال السابقة التي كانت تحسّن الحقول العشوائية الماركوفية باستخدام خوارزميات تكرارية، نقترح حلًا للحقل العشوائي الماركوفي عبر شبكة عصبية تقنية التعلم العميق (CNN)، والتي أطلقنا عليها اسم شبكة التحليل العميقة (DPN). هذه الشبكة تمكن الحسابات المحددة من البداية إلى النهاية في عملية تمرير واحدة فقط. تحديدًا، تقوم DPN بتوسيع هندسة شبكة عصبية تقنية التعلم العميق المعاصرة لنمذجة المصطلحات الأحادية، وتم تصميم طبقات إضافية بعناية لتقريب خوارزمية المجال المتوسط (MF) للمصطلحات الثنائية. وتتميز هذه الشبكة بعدة خصائص جاذبة:أولاً، على عكس الأعمال الحديثة التي جمعت بين شبكات التعلم العميق والحقول العشوائية الماركوفية، حيث كانت تتطلب العديد من التكرارات لخوارزمية المجال المتوسط لكل صورة أثناء مرحلة التدريب العكسي، فإن DPN قادرة على تحقيق أداء عالٍ بتقريب تكرار واحد فقط من خوارزمية المجال المتوسط.ثانيًا، تمثل DPN أنواعًا مختلفة من المصطلحات الثنائية، مما يجعل العديد من الأعمال القائمة حالات خاصة منها.ثالثًا، تسهل DPN عملية موازاة وتسريع خوارزمية المجال المتوسط في وحدة المعالجة الرسومية (GPU).تم تقييم DPN بشكل شامل على مجموعة بيانات PASCAL VOC 2012، حيث حقق نموذج واحد منها دقة تقسيم جديدة تعد أفضل ما تم الوصول إليه حتى الآن.