ال أمثلة السلبية الصعبة صعبة، ولكنها مفيدة

الخسارة الثلاثية (Triplet Loss) هي طريقة شائعة جدًا في تعلم قياس المسافة. يتم فيها تحسين التمثيلات (التمثيلات المُضمنة) للصور التي تنتمي إلى نفس الفئة بحيث تُرَتَّب أقرب إلى بعضها في فضاء التضمين، مقارنةً بالتمثيلات للصور التي تنتمي إلى فئات مختلفة. وتركز الكثير من الأبحاث المتعلقة بالخسارة الثلاثية على اختيار أزواج الصور الثلاثية الأكثر فائدة، وذلك من خلال استراتيجيات تختار أمثلة غير متشابهة من نفس الفئة، أو أمثلة متشابهة من فئات مختلفة. وقد أجمع الباحثون السابقون على أن التحسين باستخدام أمثلة "السلبية الصعبة" (hardest negative examples) يؤدي إلى سلوك تدريب سيئ. وهذا يُعد مشكلة حقيقية، لأن هذه الأمثلة الصعبة هي بالضبط الحالات التي يفشل فيها قياس المسافة في التقاط التشابه الدلالي. في هذا البحث، نُصَفِّي فضاء الأمثلة الثلاثية، ونستنتج الأسباب التي تجعل الأمثلة السلبية الصعبة تؤدي إلى فشل تدريب الخسارة الثلاثية. كما نُقدِّم حلًا بسيطًا للدالة الخسارة، ونُظهر أن هذا التصحيح يجعل من الممكن التحسين باستخدام الأمثلة السلبية الصعبة. ونتيجة لذلك، نحصل على ميزات أكثر قابلية للتطبيق العام، وأداءً أفضل في مهام استرجاع الصور مقارنةً بأفضل النماذج الحالية، خاصةً على مجموعات بيانات تتميز بتباين عالٍ داخل الفئة.