التعلم الديناميكي للمقياس: نحو فضاء مقياس قابل للتوسع لاستيعاب مقياسين معنويين متعددين

يقدّم هذا البحث سمة أساسية جديدة، وهي "نطاق الديناميكية" (dynamic range)، من أدوات القياس الواقعية إلى مجال التعرف البصري العميق. في علم القياس (المترولوجيا)، يُعدّ نطاق الديناميكية خاصية أساسية لأدوات القياس، ويعكس مرونتها في التكيف مع مجاورات مختلفة من الأحجام. وكلما زاد نطاق الديناميكية، زادت المرونة. في مجال التعرف البصري، توجد أيضًا مشكلة المقياس المتعدد. قد تمتلك المفاهيم البصرية المختلفة مجاورات دلالية مختلفة. على سبيل المثال، يمتلك مفهوما "الحيوانات" و"النباتات" نطاقًا دلاليًا كبيرًا، بينما يمتلك مفهوم "الإيل" نطاقًا دلاليًا أصغر بكثير. في نطاق دلالي صغير، قد تبدو حيوانان من نوع الإيل مختلفين جدًا بعضهما عن بعض. ولكن في نطاق دلالي كبير (مثل الفئات العامة للحيوانات والنباتات)، ينبغي أن يُقاس هذان الحيوانان على أنهما متشابهان. نحن نجادل بأن هذه المرونة ضرورية أيضًا في تعلّم القياس العميق، نظرًا لأن المفاهيم البصرية المختلفة تتوافق فعلاً مع مجاورات دلالية متفاوتة.بإدخال مفهوم نطاق الديناميكية إلى تعلّم القياس العميق، نحصل على مهمة جديدة في مجال رؤية الحاسوب، تُعرف بـ "تعلم القياس الديناميكي" (Dynamic Metric Learning). وتهدف هذه المهمة إلى تعلّم فضاء قياسي قابل للتوسيع، قادر على استيعاب المفاهيم البصرية عبر مجاورات دلالية متعددة. بناءً على ثلاث أنواع من الصور، وهي: المركبات، والحيوانات، والمنتجات عبر الإنترنت، قمنا ببناء ثلاث مجموعات بيانات مخصصة لتعلم القياس الديناميكي. قمنا بوضع هذه المجموعات تحت اختبار طرق شائعة لتعلم القياس العميق، ووجدنا أن تعلم القياس الديناميكي يُعدّ مهمة صعبة جدًا. وتكمن الصعوبة الرئيسية في التناقض بين المجاورات المختلفة: غالبًا ما تُضعف القدرة التمييزية في المقياس الصغير القدرة التمييزية في المقياس الكبير، والعكس صحيح. كمساهمة ثانوية، نقترح طريقة تُسمى "التعلم عبر المقياس" (Cross-Scale Learning - CSL)، لتخفيف هذا التناقض. ونُظهر أن CSL تُحسّن باستمرار الأداء المبني على النموذج الأساسي (baseline) في جميع المجموعات الثلاث. وستكون المجموعات البيانات والكود متاحين للجمهور على الرابط: https://github.com/SupetZYK/DynamicMetricLearning.