التمثيل المعمق للخصائص مع الوعي بالتشابه المحلي

الطرق الحالية للغرس العميق في مهام الرؤية قادرة على تعلم فضاء أقليديسي مضغوط من الصور، حيث تمثل المسافات الأقليدية مقاييس للتشابه. لجعل التعلم أكثر فعالية وكفاءة، يتم عادة استخدام التنقيب عن العينات الصعبة، وذلك من خلال تحديد العينات عبر حساب المسافة الأقليدية للميزات. ومع ذلك، لا يمكن للمسافة الأقليدية العالمية أن تعبر بدقة عن التشابه الحقيقي للميزات في فضاء ميزات بصرية معقد، حيث قد تكون المسافة داخل الفئة في منطقة كثيفة أكبر من المسافة بين الفئات في المناطق ذات الكثافة المنخفضة. في هذا البحث، نقدم وحدة الغرس العميق المعتمدة على الموضع (PDDM)، وهي قادرة على تعلم مقاييس تشابه متكيفة مع بنية الميزات المحلية. يمكن استخدام هذه المقاييس لاختيار العينات الصعبة الحقيقية في الجوار المحلي لتوجيه عملية الغرس العميق بطريقة مستمرة وقوية. يُعد هذا الطبق الجديد جذابًا لأنه يمكن إدراجه في أي شبكات ارتباطية ويتم تدريبه بشكل شامل. لقد أظهرت تقنية غرس الميزات التي تعي الاهتمام بالتشابه المحلي ليس فقط سرعة التقارب وأداءً أفضل على مجموعة بيانات استرجاع صور معقدة اثنين، بل أدت طبيعتها ذات الهامش الكبير أيضًا إلى نتائج تعميم أفضل تحت ظروف النقل التعلمي والمجموعات الكبيرة والمفتوحة والتعلم بدون أمثلة (zero-shot learning) على مجموعة بيانات ImageNet 2010 ومجموعة بيانات ImageNet-10K.