التعلم المتناقض المراقب المُوجَّه مع تسميات ضوضائية

الشبكات العميقة تمتلك قدرات قوية في تضمين البيانات إلى تمثيلات خفية وإتمام المهام اللاحقة. ومع ذلك، فإن هذه القدرات تعتمد إلى حد كبير على العلامات المُعلَّمة عالية الجودة، والتي تكون مكلفة جدًا في جمعها. أما العلامات الضوضائية فهي أكثر تكلفة مقبولة، إلا أنها تؤدي إلى تمثيلات مُتضررة، ما يُضعف الأداء العام. لتعلم تمثيلات مقاومة للضوضاء وعلاج مشكلة العلامات غير الدقيقة، نقترح في هذه الورقة تعلم التمثيل المتناقض المُوجَّه المُختَارة (Sel-CL). وبشكل خاص، يُوسِّع Sel-CL التعلم المتناقض المُوجَّه (Sup-CL)، الذي يُعدّ قويًا في تعلم التمثيلات، لكنه يُعاني من التدهور عند وجود علامات ضوضائية. ويُعالج Sel-CL السبب المباشر لمشكلة Sup-CL، وهو أن Sup-CL يعمل بطريقة زوجية (pair-wise)، مما يؤدي إلى تضليل عملية تعلم التمثيل بسبب الأزواج الضوضائية الناتجة عن العلامات الخاطئة. ولتخفيف هذه المشكلة، نقوم باختيار الأزواج الموثوقة من بين الأزواج الضوضائية دون الحاجة إلى معرفة معدلات الضوضاء. في عملية الاختيار، نقيس التوافق بين التمثيلات المُتعلمة والعلامات المعطاة، ونُحدِّد أولًا الأمثلة الموثوقة التي تُستخدم لبناء أزواج موثوقة. ثم نستفيد من توزيع تشابه التمثيلات في الأزواج الموثوقة المُكوَّنة لتحديد أزواج إضافية موثوقة من بين الأزواج الضوضائية. وأخيرًا، تُستخدم جميع الأزواج الموثوقة المُكتسبة في Sup-CL لتعزيز التمثيلات. أظهرت التجارب على عدة مجموعات بيانات ضوضائية مقاومة التمثيلات المُتعلمة بواسطة طريقةنا، مع تحقيق أداء يُنافس أحدث النماذج. يمكن الوصول إلى الشيفرة المصدرية عبر الرابط: https://github.com/ShikunLi/Sel-CL