التعلم التمييزي لملامح نقاط الميزة التلافيفية العميقة

أحدث التعلم العميق ثورة في المهام ذات المستوى الصورية مثل التصنيف، لكن المهام ذات المستوى القطعي، مثل التوافق، ما زالت تعتمد على الميزات المُصممة يدويًا، مثل SIFT. في هذه الورقة، نستخدم الشبكات العصبية التلافيفية (CNNs) لتعلم تمثيلات مميزة للقطع، ونركز بشكل خاص على تدريب شبكة سياميز باستخدام أزواج من القطع (المتوافقة وغير المتوافقة). نتعامل مع العدد الكبير من الأزواج المحتملة من خلال الجمع بين عينة عشوائية من مجموعة التدريب واستراتيجية استخراج جريئة مُتحيزة نحو القطع التي يصعب تصنيفها. وباستخدام المسافة L2 أثناء التدريب والاختبار، نطور وصفات ببعد 128، حيث تعكس المسافات الإقليدية التشابه بين القطع، ويمكن استخدامها كاستبدال مباشر لأي مهمة تتضمن SIFT. نُظهر تحسينات مستمرة في الأداء مقارنة بأحدث التقنيات، ونُظهر قدرة عامة جيدة على التكيف مع التغيرات في التكبير والدوران، والتحولات المنظورية، والتشوهات غير المرنة، وتغيرات الإضاءة. وتشتهر هذه الوصفات بسهولة الحساب وملاءمتها للرسومات الحديثة (GPUs)، وهي متاحة للجمهور.