MaskCon: التعلم التبايني المقنع لقواعد البيانات ذات التسميات الخشنة

حققت التعلم العميق نجاحًا كبيرًا في السنوات الأخيرة بفضلهياكل الشبكات العصبية المتقدمة ومجموعات البيانات المُشَرَّحَة من قبل البشر على نطاق واسع.ومع ذلك، غالبًا ما يكون تحليل مجموعات البيانات الكبيرة بدقة وكفاءة باهظ التكاليف ومعقدًا،خاصة في بعض المجالات المتخصصة التي تتطلب تسميات دقيقة. في هذا السياق، تكون التسميات الخشنةأسهل للحصول عليها لأنها لا تتطلب معرفة خبراء. في هذا العمل، نقترح طريقة تعلم تباينية،تُسَمَّى التعلم التبايني المُغَطَّى (Masked Contrastive Learning) ($\textbf{MaskCon}$)لمعالجة مشكلة غير مستكشفة بشكل كافٍ، حيث نتعلم باستخدام مجموعة بيانات مُشَرَّحَة بالتسميات الخشنةمن أجل معالجة مشكلة التسميات الدقيقة. وبشكل أكثر تحديدًا، ضمن إطار التعلم التبايني،تولد طريقتنا تسميات ناعمة لعينة كل واحدة بمساعدة التسميات الخشنة ضد عينات أخرىونظرية مكملة مُزَاوِجَة للعينة المعنية. بخلاف التعلم التبايني الذاتي-المشرف عليه، حيث يتم اعتبار فقطالمكملات الخاصة بالعينة إيجابية صارمة، وفي التعلم التبايني المشرف عليه، حيث يتم اعتبار فقط العيناتذات نفس التسميات الخشنة إيجابية صارمة، نقترح تسميات ناعمة تعتمد على المسافات بين العيناتوتُغطى بالتسميات الخشنة. وهذا يتيح لنا الاستفادة من العلاقات بين العينات والتسميات الخشنة معًا.نوضح أن طريقتنا يمكن أن تحصل على العديد من الأعمال الرائدة الحالية كحالات خاصة وأنها توفر حدودًا أضيقعلى خطأ التجريد. تجريبيًّا، حققت طريقتنا تحسينًا كبيرًا على الحالة الراهنة للتقنية الرائدة في مختلف مجموعات البيانات,بما في ذلك مجموعات CIFAR10 وCIFAR100 وImageNet-1K وStanford Online Products وStanford Cars196.الرمز البرمجي والتحليل متوفرون على https://github.com/MrChenFeng/MaskCon_CVPR2023.