تعلم تكوين الأعمدة الفائقة للاستدلال البصري

تلعب تمثيلات الميزات دورًا حاسمًا في التوافق البصري، وتعتمد الأساليب الحديثة لتوافق الصور على طبقات تلافيفية عميقة متعددة. ومع ذلك، فإن هذه النماذج تكون متكاملة وثابتة في طبيعتها، حيث تستخدم عادةً مستوى معينًا من الميزات، مثل مخرج الطبقة الأخيرة، وتحتفظ به بغض النظر عن الصور التي يتم مطابقتها. في هذا العمل، نقدم نهجًا جديدًا للتوافق البصري يُكوّن بشكل ديناميكي ميزات فعّالة من خلال الاستفادة من الطبقات ذات الصلة، مع تكييفها وفقًا للصور التي يتم مطابقتها. مستلهمين من تكوين الميزات متعددة الطبقات في الكشف عن الأجسام، والهياكل المتكيفة للاستدلال في التصنيف، فإن النهج المقترح، الذي أُطلق عليه اسم "تدفق الهيبربكسل الديناميكي" (Dynamic Hyperpixel Flow)، يتعلم تكوين ميزات الهيبركولومن بشكل فوري من خلال اختيار عدد صغير من الطبقات ذات الصلة من شبكة عصبية تلافيفية عميقة. ونُظهر فعالية هذا النهج في مهمة التوافق المعنوي، أي إقامة توافق بين صور تمثل حالات مختلفة من نفس الفئة الكائنية أو المشهدية. وتُظهر التجارب على المعايير القياسية أن الطريقة المقترحة تحسن بشكل كبير من أداء المطابقة مقارنة بالأساليب الرائدة في المجال، وبطريقة متكيفة وفعّالة.