التعلم غير المشرف من خلال التعلم الأداتي

من الأهداف المركزية للتعلم غير المشرف هو اكتساب تمثيلات من البيانات غير المصنفة أو الخبرات التي يمكن استخدامها لتحسين التعلم الفعال للمهام اللاحقة باستخدام كميات معتدلة من البيانات المصنفة. وقد سعت العديد من الأعمال السابقة في مجال التعلم غير المشرف إلى تحقيق هذا الهدف من خلال تطوير أهداف بديلة تعتمد على إعادة الإنشاء، فك التشابك، التنبؤ، وغيرها من المقاييس. بدلاً من ذلك، قمنا بتطوير طريقة تعلم متعدد غير مشرف تُحسِّن صراحةً قدرة التعلم لمجموعة متنوعة من المهام باستخدام كميات صغيرة من البيانات. لتحقيق هذا، نقوم ببناء المهام من البيانات غير المصنفة بطريقة آلية وتنفيذ التعلم المتعدد على المهام المحصلة. بشكل مفاجئ، وجدنا أن آليات بناء المهام البسيطة نسبيًا، مثل تجميع التمثيلات (clustering embeddings)، تقود إلى أداء جيد في مجموعة متنوعة من المهام اللاحقة التي حددتها البشر. تجاربنا على أربع مجموعات بيانات صورية تشير إلى أن نهجنا للتعلم المتعدد غير المشرف يكتسب خوارزمية تعلم دون أي بيانات مصنفة قابلة للتطبيق على نطاق واسع من مهام تصنيف اللاحقة، مما يحسن الأداء عن التمثيل الذي تم تعلمه بواسطة أربع طرق سابقة للتعلم غير المشرف.