HyperAIHyperAI
منذ 15 أيام

التعلم المُحرَّر من التحيز من العلامات الاصطناعية غير المتوازنة بطبيعتها

Xudong Wang, Zhirong Wu, Long Lian, Stella X. Yu
التعلم المُحرَّر من التحيز من العلامات الاصطناعية غير المتوازنة بطبيعتها
الملخص

الوسوم الزائفة هي تنبؤات موثوقة تُولَد من بيانات الهدف غير المُعلَّمة بواسطة فئة تم تدريبها على بيانات المصدر المُعلَّمة. تُستخدم هذه الوسوم على نطاق واسع في عملية تكييف النموذج مع البيانات غير المُعلَّمة، مثل في البيئة التعلم شبه المُراقبة.إن رؤيتنا الأساسية تتمثل في أن الوسوم الزائفة تكون متوازنة بشكل طبيعي بسبب التشابه الداخلي في البيانات، حتى عندما يتم تدريب النموذج على بيانات مصدر متوازنة وتُجرى تقييماته على بيانات هدف متوازنة. إذا تناولنا هذه المشكلة غير المعروفة سابقًا المتعلقة بالتوازن غير المتكافئ في التصنيف الناتجة عن الوسوم الزائفة، بدلًا من الاعتماد على الوسوم الحقيقية المستخدمة في التدريب، فإننا نستطيع القضاء على التحيزات التي يُظهرها النموذج تجاه "الأغلبية الخاطئة" التي تنشأ من الوسوم الزائفة.نُقدّم طريقة جديدة وفعّالة للتعلم الخالي من التحيز باستخدام الوسوم الزائفة، تعتمد على التفكير الاستدلالي (الاستنتاج العكسي) والحدود التكيفية: حيث تُزيل الطريقة الأولى التحيز في استجابة الفئة، بينما تُعدّل الثانية الحدود لكل فئة وفقًا لدرجة عدم التوازن في الوسوم الزائفة. وقد تم التحقق من فعالية هذه الطريقة البسيطة من خلال تجارب واسعة النطاق، حيث حققت تحسينات كبيرة في الدقة مقارنة بالأساليب الرائدة على مجموعة بيانات ImageNet-1K: 26% في التعلم شبه المُراقب مع 0.2% من العلامات، و9% في التعلم الصفري (zero-shot). يمكن الوصول إلى الكود الخاص بنا عبر الرابط التالي: https://github.com/frank-xwang/debiased-pseudo-labeling.

التعلم المُحرَّر من التحيز من العلامات الاصطناعية غير المتوازنة بطبيعتها | أحدث الأوراق البحثية | HyperAI