HyperAIHyperAI
منذ 11 أيام

PT4AL: استخدام مهام مُسبقة ذاتية التدريب للتعلم النشط

John Seon Keun Yi, Minseok Seo, Jongchan Park, Dong-Geol Choi
PT4AL: استخدام مهام مُسبقة ذاتية التدريب للتعلم النشط
الملخص

تصنيف مجموعة كبيرة من البيانات مكلف. يهدف التعلم النشط إلى معالجة هذه المشكلة من خلال طلب التصنيف فقط للبيانات الأكثر إفادة من بين البيانات غير المصنفة. نقترح منهجًا جديدًا للتعلم النشط يستخدم مهامًا وهمية ذات إشراف ذاتي (self-supervised pretext tasks) ومُعدّل بيانات فريد لاختيار بيانات تكون صعبة وتمثيلية في آنٍ واحد. اكتشفنا أن خسارة مهمة وهمية بسيطة ذات إشراف ذاتي، مثل تنبؤ الاتجاه (rotation prediction)، مرتبطة بشكل وثيق بخسارة المهمة الأساسية (downstream task loss). قبل بدء تكرارات التعلم النشط، يتم تدريب مُتعلم المهمة الوهمية على مجموعة البيانات غير المصنفة، ثم تُرتّب البيانات غير المصنفة وتنقسم إلى مجموعات (بatches) حسب خسائرها في المهمة الوهمية. في كل تكرار من تكرارات التعلم النشط، يُستخدم نموذج المهمة الأساسية لاختيار البيانات الأكثر غموضًا ضمن المجموعة لتصنيفها. قمنا بتجريب منهجنا على مجموعة متنوعة من معايير التصنيف والتقسيم الصوتي للصور، وحققنا أداءً متميزًا على مجموعات بيانات CIFAR10 وCaltech-101 وImageNet وCityscapes. كما أظهرنا أن منهجنا يعمل بشكل جيد على البيانات غير المتوازنة، ويمكن أن يكون حلاً فعّالًا لمشكلة البدء البارد (cold-start problem)، حيث يتأثر أداء التعلم النشط بعينة أولية مصنفة عشوائيًا.

PT4AL: استخدام مهام مُسبقة ذاتية التدريب للتعلم النشط | أحدث الأوراق البحثية | HyperAI