وصف Twin-Net: استخراج سالب مزدوج مع خسارة رباعية للتطابق القائم على اللوحة
يُعد التوقيع المحلي للمفاتيح خطوة مهمة في المهام القائمة على الرؤية الحاسوبية. في السنوات الأخيرة، تم استخدام استراتيجيات تعتمد على الشبكات العصبية التلافيفية العميقة (CNN) لتعلم إنشاء الوصفات بهدف تحسين دقة التوقيع للمفاتيح. تُركّز الأعمال الحديثة المتميزة في هذا المجال بشكل رئيسي على دالة خسارة تعتمد على ثلاثية العينات (وأمثلتها المختلفة)، والتي تتضمن عينة مرجعية (Anchor)، وعينة إيجابية (Positive)، وعينة سلبية (Negative). في هذه الدراسة، نقترح استراتيجية عينة جديدة تعتمد على "استخراج السلبيات المزدوجة" (Twin Negative Mining) مصحوبة بدالة خسارة رباعية (Quad loss function) لتدريب نموذج شبكي عصبي عميق (Twin-Net) لإنشاء وصفة قوية تُعزز القدرة التمييزية على التمييز بين البُقع التي لا تمثل نفس الموقع. تهدف استراتيجيتنا في اختيار العينات ودالة الخسارة إلى وضع حد علوي ينص على أن الفروق بين وصفات بُقعتين تمثلان نفس الموقع لا يمكن أن تكون أبعد من الفروق بين وصفات بُقعتين تشبهان بعضهما ولكنها لا تنتميان إلى نفس الموقع الثلاثي الأبعاد. يؤدي هذا إلى تحسين قدرة الشبكة على التعميم، ويُفوق نماذجه الحالية عند تدريبها على نفس المجموعات البيانات. يُنتج Twin-Net وصفة بـ 128 بعدًا، ويستخدم المسافة اللأسية (L2 Distance) كمقياس للتشابه، وبالتالي يتوافق مع أنماط التوقيع التقليدية مثل تلك المستخدمة في SIFT. تُظهر النتائج المُحققة على مجموعتي البيانات Brown وHPatches تفوق Twin-Net المستمر في الأداء، إضافة إلى قدرته الأفضل على التمييز والقدرة على التعميم مقارنةً بأفضل الحلول الحالية.