شبكات العصبيات المتكررة ذات التوجيه الثنائي (DAG) لتصنيف المشاهد

في تصنيف الصور، يتم عادةً توليد التمثيلات المحلية للوحدات الصورية من الأجزاء المحيطة بها في الصورة، مما يجعل المعلومات السياقية على المدى الطويل غير مُشفرة بشكل فعال. في هذا البحث، نقدم شبكات العصبي المتكررة (RNNs) لمعالجة هذه المشكلة. وبشكل خاص، تم اقتراح شبكات العصبي المتكررة ذات الرسم البياني الموجه غير الدائري (DAG-RNNs) لمعالجة الصور ذات البنية الموجهة غير الدائرية (DAG)، مما يمكّن الشبكة من نمذجة الارتباطات الدلالية على المدى الطويل بين الوحدات الصورية. تمتلك شبكاتنا DAG-RNN القدرة على تعزيز قوة التمييز للتمثيلات المحلية بشكل كبير، مما يفيد بشكل ملحوظ تصنيف الوحدات المحلية. وفي الوقت نفسه، نقترح دالة وزن جديدة للتصنيفات تركز على الفئات النادرة، مما يعزز بشكل ملحوظ دقة التعرف على الفئات غير المتكررة. عند دمجها مع طبقات التفتيش والتفتيش العكسي، تحقق شبكاتنا DAG-RNN نتائج جديدة رائدة في مقاييس SiftFlow وCamVid وBarcelona الصعبة.