التعلم التبايني
ملخص
التعلم المقارن هو تقنية تعمل على تعزيز أداء مهام الرؤية باستخدام مبدأ مقارنة العينات مع بعضها البعض لتعلم الخصائص المشتركة بين فئات البيانات والخصائص التي تميز فئة بيانات واحدة عن أخرى.
لقد أظهر نموذج التعلم هذا، الذي يحاكي الطريقة التي يتعلم بها البشر عن العالم من حولهم، نتائج واعدة في أدبيات التعلم العميق وأصبح مهمًا بشكل متزايد في مجال أبحاث الرؤية الحاسوبية.
ما هو التعلم التبايني؟
التعلم المقارن هو نموذج للتعلم الآلي حيث يتم وضع نقاط البيانات غير المسمىة مقابل بعضها البعض لتعليم النموذج أي النقاط متشابهة وأيها مختلفة.
وهذا يعني، كما يوحي الاسم، أن العينات تتناقض مع بعضها البعض، ويتم دفع العينات التي تنتمي إلى نفس التوزيع نحو بعضها البعض في مساحة التضمين. وبدلاً من ذلك، يتنافس أولئك الذين ينتمون إلى توزيعات مختلفة مع بعضهم البعض.
أهمية التعلم التبايني
التعلم الخاضع للإشراف هو أحد تقنيات التعلم الآلي التي تدرب نموذجًا باستخدام عدد كبير من الأمثلة المسمى. إن جودة تسميات البيانات أمر بالغ الأهمية لنجاح النماذج الخاضعة للإشراف.
ومع ذلك، فإن الحصول على مثل هذه البيانات المصنفة عالية الجودة يعد مهمة شاقة، وخاصة في مجالات مثل التصوير الطبي الحيوي، والتي تتطلب أطباء خبراء لشرح البيانات. وهذا أمر مكلف ويستغرق وقتا طويلا. تم استثمار 80% من الوقت في الحصول على البيانات وتنظيفها لتدريب النموذج.
لذلك، ركزت الأبحاث الحديثة في مجال التعلم العميق على تقليل متطلبات الإشراف في تدريب النموذج. ولتحقيق هذه الغاية، تم اقتراح عدة أساليب، مثل التعلم شبه الخاضع للإشراف، والتعلم غير الخاضع للإشراف، والتعلم الذاتي الإشراف.
في التعلم شبه الخاضع للإشراف، يتم استخدام كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المصنفة لتدريب نموذج عميق. في التعلم غير الخاضع للإشراف، يحاول النموذج فهم البيانات غير المنظمة دون أي تسميات للبيانات.
يتخذ التعلم الذاتي الإشرافي (SSL) نهجًا مختلفًا بعض الشيء.
كما هو الحال مع التعلم غير الخاضع للإشراف، يتم توفير البيانات غير المنظمة كمدخلات للنموذج. ومع ذلك، يقوم النموذج بشرح البيانات من تلقاء نفسه، ويتم استخدام العلامات المتوقعة بثقة عالية كحقيقة أساسية في التكرارات المستقبلية لتدريب النموذج.
يؤدي هذا إلى تحسين أوزان النموذج بشكل مستمر لتقديم تنبؤات أفضل. لقد جذبت فعالية طرق SSL مقارنة بالطرق الإشرافية التقليدية انتباه العديد من الباحثين في مجال الرؤية الحاسوبية.
أحد أقدم وأشهر التقنيات المستخدمة في SSL هو التعلم التبايني، والذي يستخدم أمثلة "إيجابية" و"سلبية" لتوجيه نموذج التعلم العميق.
لقد تم تطوير التعلم التبايني منذ ذلك الحين بشكل أكبر ويُستخدم الآن في الإعدادات الخاضعة للإشراف الكامل وشبه الإشراف، ويحسن أداء التقنيات الحديثة الحالية.
إطار التعلم التبايني
هناك ثلاث آليات عمل شائعة لأطر التعلم التبايني اقترحها باحثو التعلم العميق ورؤية الكمبيوتر في الأدبيات الحديثة.
1.SimCLR
نموذج SimCLR، الذي طورته Google Brain، هو إطار عمل للتعلم التبايني للتمثيلات المرئية. تم اقتراح SimCLR لمعالجة مشاكل التعلم الخاضع للإشراف الذاتي وشبه الخاضع للإشراف من خلال التعلم التبايني.
مبدأ عملها الأساسي هو الاستفادة من الخسارة التباينية في الفضاء الكامن لتعظيم الاتساق بين الإصدارات المحسنة المختلفة لنفس العينة.
2. NNCLR
تقوم معظم خوارزميات التعلم التبايني التمييزي بتدريب المبرمج ليكون ثابتًا بالنسبة للتحويلات المحددة مسبقًا لنفس المثيل.
في حين أن معظم الطرق تعتبر وجهات نظر مختلفة لنفس الصورة كقيم إيجابية للخسارة التباينية، فإن إطار التعلم التبايني لأقرب جار (NNCLR) الذي تم تطويره في هذه الورقة يحاول استخدام قيم إيجابية من حالات أخرى في مجموعة البيانات، أي باستخدام صور مختلفة من مجموعة البيانات. نفس الفئة، بدلاً من تعزيز نفس الصورة.
3. بي سي إل
التعلم التبايني النموذجي (PCL) هو أسلوب تعلم تمثيلي غير خاضع للإشراف يجمع بين التعلم التبايني والتجميع. يتعلم PCL الميزات منخفضة المستوى مثل مهام التمييز ويقوم أيضًا بتشفير البنية الدلالية التي تم اكتشافها من خلال التجميع في مساحة التضمين المكتسبة.
مراجع
【1】https://www.v7labs.com/blog/contrastive-learning-guide#ten-contrastive-learning-frameworks