فقدان الثلاثي
خسارة الثلاثية هي دالة خسارة للتعلم العميق، والتي تشير إلى تقليل المسافة بين نقطة الارتكاز والعينة الإيجابية بنفس الهوية، وتقليل المسافة بين نقطة الارتكاز والعينة السلبية بهويات مختلفة.
يشير مصطلح "الثلاثي" إلى ثلاث نقاط بيانات:نقطة الارتكاز،الالتزام بالمواعيدونقطة سلبية. المرساة هي نقطة البيانات المركزية التي سيتم تعلم التضمين فيها، والنقاط الإيجابية هي نقاط بيانات مماثلة للمرساة (على سبيل المثال صور لنفس الفرد)، والنقاط السلبية هي نقاط بيانات مختلفة تمامًا عن المرساة. مختلفة عن المراسي (على سبيل المثال، صور الأفراد غير المرتبطين ببعضهم البعض).
من الناحية الرياضية، يمكن التعبير عن الخسارة الثلاثية على النحو التالي:

- تمثل f() الوظيفة المسؤولة عن إنشاء التضمين.
- أ = صورة المرساة
- p تعني صورة إيجابية
- n يمثل الصورة السلبية
- Ɑ يمثل معلمة الهامش الفائقة، والتي تحدد الحد الأدنى للفاصل بين مسافات التضمين الإيجابية والسلبية.
يكمن جوهر دالة الخسارة الثلاثية في الهامش α، وهو معامل فائق يحدد الحد الأدنى المطلوب للفرق بين المسافات التربيعية للتضمينات الموجبة والسالبة للمرساة. ومن خلال فرض هذا الهامش، تشجع دالة الخسارة توزيعًا مثاليًا بين المسافات الإيجابية والسلبية، مما يخلق بيئة مواتية لتعلم التمثيلات ذات المعنى. يتم حساب هذه المسافات الإيجابية والسلبية باستخدام مقياس المسافة (عادةً المسافة الإقليدية).
يعتمد Triplet Loss على الهدف الأساسي المتمثل في تعلم كيفية تضمين العلاقات الجوهرية بين نقاط البيانات البارزة. وهذا يختلف عن وظائف الخسارة التقليدية، والتي تم تصميمها بشكل أساسي لمهام مثل التصنيف أو التنبؤ بالقيمة. في السيناريوهات مثل التعرف على الوجه، حيث تكون الاختلافات الدقيقة في ملامح الوجه أمرًا بالغ الأهمية، فإن التضمينات (أو الترميزات) التي يمكنها التمييز بين الأفراد بطريقة لا يمكن تحقيقها بسهولة باستخدام وحدات البكسل الخام تكون ذات قيمة لا تقدر بثمن.
وتظهر خسارة الثلاثي كحل لهذا التحدي. من خلال تشجيع الشبكة العصبية على تعلم التضمينات استنادًا إلى سياق الأمثلة الإيجابية والسلبية بالنسبة لحالات المرساة، فإننا نفتح الباب للحصول على ميزات تمييزية تلتقط جوهر علاقات البيانات بشكل جوهري.
استراتيجية الاختيار الثلاثي
يعد اختيار الثلاثي الصحيح أمرًا بالغ الأهمية لفعالية فقدان الثلاثي. في الممارسة العملية، قد يؤدي اختيار الثلاثيات بشكل عشوائي إلى تقارب بطيء أو حلول دون المستوى الأمثل. لذلك، يتم اعتماد استراتيجيات متعددة لاختيار الثلاثيات المعلوماتية بشكل فعال:
- التعدين الثلاثي عبر الإنترنت:بدلاً من استخدام كل الثلاثيات الممكنة، يقوم التعدين الثلاثي عبر الإنترنت باختيار الثلاثيات بناءً على قيمة الخسارة. يتم استخدام الثلاثيات الأكثر تحديًا فقط، أي تلك التي تحتوي على قيم خسارة قريبة من الصفر، لحساب التدرج. يعمل هذا النهج على تسريع التقارب ويركز عملية التعلم على الأمثلة الصعبة.
- التعدين السلبي الصعب:يجب أن يكون من الصعب التمييز بين العينات السلبية المختارة للثلاثية والمرسيات أكثر من العينات الإيجابية. يتضمن التعدين السلبي الصعب اختيار الأمثلة السلبية التي تنتهك الهامش إلى أقصى حد، وبالتالي ضمان تعلم الشبكة بشكل أكثر فعالية من الحالات الصعبة.
- الحفر السلبي شبه الصلب:يهدف إلى إيجاد التوازن بين السلبيات المختارة عشوائيًا والسلبيات الصعبة. إن السلبية شبه الصلبة هي سلبية أبعد عن نقطة الارتكاز من الإيجابية ولكنها لا تزال تحتوي على قيمة خسارة إيجابية. إنها توفر أرضية مشتركة تساعد الشبكة على التعميم بشكل أفضل دون التقارب إلى حل بسيط.
متغير الخسارة الثلاثية
لقد خضعت الصيغة الأساسية لـ Triplet Loss للعديد من التغييرات والتحسينات لتحسين فعاليتها:
- خسارة ثلاثية صعبة في الدفعة:بدلاً من تحديد أصعب مثال سلبي لكل زوج إيجابي من المرساة، تأخذ هذه الطريقة بعين الاعتبار أصعب الأمثلة السلبية في مجموعة من أمثلة التدريب. يأخذ هذا في الاعتبار الاختلافات داخل الدفعة ويمكن أن يحسن الكفاءة الحسابية.
- الخسارة التباينية:يمكن النظر إلى الخسارة الثلاثية باعتبارها امتدادًا للخسارة التباينية، حيث يتم بدلاً من الثلاثيات، اعتبار أزواج من الأمثلة الإيجابية الثابتة والسلبية الثابتة.
- خسارة رباعية:يتضمن هذا الامتداد إضافة مثال إيجابي ثانٍ إلى الثلاثية، مما يؤكد بشكل أكبر على العلاقة بين المرساة والمثال الإيجابي.
- الخسائر القائمة على الوكالة:تتضمن الطرق المعتمدة على الوكيل تعلم مجموعة من متجهات الوكيل التي تمثل فئات مختلفة. تعمل هذه الوكلاء كمعالم في مساحة التضمين، مما يجعل من الأسهل تكوين الثلاثيات وتعلم التمثيلات ذات المغزى.
تطبيق الخسارة الثلاثية
إن فقدان الثلاثية له تطبيقات في مجالات مختلفة، وخاصة عندما يكون تعلم التضمينات ذات المغزى أمرًا بالغ الأهمية:
- التعرف على الوجه: كان أحد أقدم تطبيقات Triplet Loss في مجال الرؤية الحاسوبية، وخاصة التعرف على الوجوه. من خلال تعلم التضمينات التي تقلل من التباين داخل الشخص وتعظم التباين بين الأشخاص، يساعد Triplet Loss في إنشاء تضمينات وجه قوية ومميزة.
- استرجاع الصورة: يمكن استخدام Triplet Loss لبناء أنظمة استرجاع الصور القائمة على المحتوى. يتم ترميز الصور كتضمينات، ويصبح استرجاع الصور المشابهة مشكلة في العثور على تضمينات قريبة من تضمين صورة الاستعلام.
- إعادة تحديد هوية الشخص:في السيناريوهات مثل مراقبة الفيديو، يمكن استخدام فقدان الثلاثي لتطوير نماذج يمكنها التعرف على نفس الشخص في وجهات نظر مختلفة للكاميرا، حتى تحت الإضاءة والوضعيات المختلفة.
- استرجاع المعلومات:في معالجة اللغة الطبيعية، يمكن تكييف فقدان الثلاثية لتعلم تضمينات المستندات النصية، مما يتيح البحث والتجميع القائم على التشابه.
مراجع
【1】https://encord.com/glossary/triplet-loss-definition/