التعرف على الإجراءات بدون تدريب مسبق باستخدام رموز الإخراج التصحيحية للأخطاء

في الآونة الأخيرة، ظهر التعرف على الإجراءات بدون تدريب مسبق (ZSAR) بفعل النمو الهائل في عدد فئات الإجراءات. في هذه الورقة، نستكشف ZSAR من منظور جديد من خلال اعتماد رموز الإخراج التصحيحية للأخطاء (المعروفة بـ ZSECOC). يزوّد ZSECOC النموذج التقليدي لـ ECOC بقدرة إضافية على ZSAR، وذلك من خلال معالجة مشكلة انزياح المجال (domain shift). وبشكل خاص، نتعلم رموز ZSECOC التمييزية للفئات المرئية من خلال المعاني على مستوى الفئة والهياكل الداخلية للبيانات. ويُعالج هذا الإجراء انزياح المجال بشكل ضمني من خلال نقل العلاقات المثبتة جيدًا بين الفئات المرئية إلى الفئات غير المرئية. علاوةً على ذلك، تم تطوير استراتيجية بسيطة لنقل المعاني، تهدف إلى تحويل تضمينات الفئات المرئية المُتعلّمة بشكل صريح، لتناسب بشكل أفضل البنية الكامنة للفئات غير المرئية. وبنتيجة ذلك، يرث ZSECOC الخصائص الواعدة من ECOC، ويتجاوز مشكلة انزياح المجال، مما يجعله أكثر تمييزًا في سياق ZSAR. وقد قمنا بتقييم ZSECOC بشكل منهجي على ثلاث معايير واقعية للإجراءات، وهي: Olympic Sports، وHMDB51، وUCF101. وتُظهر النتائج التجريبية بوضوح التفوق الواضح لـ ZSECOC مقارنة بالأساليب الرائدة في مجالها.