إلغاء الانحراف باستخدام الانحراف لتعزيز البيانات وطريقة عامة لتعلم البيانات متعددة الوسائط

إحدى التحديات الرئيسية في رؤية الحاسوب هي الحاجة إلى التكيّف مع الانحرافات اللونية في البيئات المتغيرة. ولهذا السبب، يُعدّ تقليل الآثار السلبية للانحراف اللوني على التنبؤ أحد الأهداف الرئيسية في المهام البصرية. وتركز الحلول الحالية على استخدام النماذج التوليدية لتعزيز بيانات التدريب بهدف تعزيز التحويلية تجاه التغيرات في المدخلات. ومع ذلك، فإن هذه الأساليب غالبًا ما تُدخل ضوضاء جديدة، مما يحد من الفائدة المُستفادة من البيانات المولّدة. ولحل هذه المشكلة، تُقدّم هذه الورقة استراتيجية تُسمّى "إسقاط اللون العشوائي" (Random Color Dropout - RCD)، والتي تهدف إلى التخلص من الانحراف من خلال الانحراف نفسه. وتعتمد فرضيتنا على أن إذا وُجد انحراف لوني بين الصورة المطلوبة (query image) والصورة في المعرض (gallery image)، فإن نتائج الاسترجاع لبعض الأمثلة ستكون أفضل عند تجاهل المعلومات اللونية. وبشكل محدد، تقوم هذه الاستراتيجية بموازنة الأوزان بين الميزات اللونية والميزات المستقلة عن اللون داخل الشبكة العصبية، وذلك عن طريق إسقاط جزء من المعلومات اللونية في بيانات التدريب، بهدف التغلب على تأثير الانحراف اللوني. ويمكن دمج RCD مع مختلف نماذج ReID الحالية دون الحاجة لتغيير استراتيجية التعلّم، كما يمكن تطبيقها في مجالات رؤية الحاسوب الأخرى مثل كشف الأشياء (object detection). وقد تأكدت فعالية هذه الطريقة من خلال تجارب على عدة قواعد بيانات معيارية لـ ReID، مثل Market1501 وDukeMTMC وMSMT17. كما أظهرت التجارب في اختبارات عبر المجالات (Cross-domain) أن هذه الاستراتيجية فعّالة جدًا في تقليل الفجوة بين المجالات. علاوةً على ذلك، ولفهم آلية عمل RCD، قمنا بتحليل فعاليتها من منظور التصنيف، ما كشف أن من الأفضل في المهام البصرية التي تعاني من تغيرات مجالية قوية الاستفادة من جزء كبير من المعلومات اللونية بدلًا من الاستفادة من جميع المعلومات اللونية.