HyperAIHyperAI
منذ 2 أشهر

التعلم شبه المشرف في العالم المفتوح

Cao, Kaidi ; Brbic, Maria ; Leskovec, Jure
التعلم شبه المشرف في العالم المفتوح
الملخص

تُعدّ الافتراض بأن البيانات الاختبارية غير المصنفة تحتوي فقط على فئات تم مواجهتها سابقًا في البيانات التدريبية المصنفة، من القيود الأساسية لتطبيق التعلم شبه المشرف (Semi-Supervised Learning) في الإعدادات الحقيقية. ومع ذلك، فإن هذا الافتراض نادرًا ما يتحقق للبيانات في البيئة الطبيعية (In-the-Wild)، حيث قد تظهر حالات تنتمي إلى فئات جديدة أثناء اختبار النموذج. في هذا السياق، نقدم إعدادًا جديدًا للتعلم شبه المشرف في عالم مفتوح (Open-World Semi-Supervised Learning) يُشكّل مفهوم أن فئات جديدة قد تظهر في البيانات الاختبارية غير المصنفة. وفي هذا الإعداد الجديد، يكون الهدف هو حل عدم التطابق في توزيع الفئات بين البيانات المصنفة وغير المصنفة، بحيث يجب تصنيف كل حالة إدخال أثناء الاختبار إما إلى إحدى الفئات الموجودة أو تعيين فئة جديدة غير مرئية.لحل هذه المشكلة الصعبة، نقترح نظام ORCA، وهو نهج للتعلم العميق من النهاية إلى النهاية (End-to-End Deep Learning Approach) يُدخل آلية هامش متكيف مع الغموض (Uncertainty Adaptive Margin Mechanism) لتلافي الانحياز نحو الفئات المرئية الناجم عن تعلم الخصائص التمييزية للفئات المرئية بسرعة أكبر من الفئات الجديدة. بهذه الطريقة، يقلل ORCA الفجوة بين التباين داخل الفئة للفئات المرئية بالنسبة للفئات الجديدة. وقد أثبتت التجارب على مجموعات بيانات تصنيف الصور ومجموعة بيانات التسميات الخلوية الواحدة أن ORCA يتخطى باستمرار الأساليب البديلة الأساسية، حيث حقق تحسينًا بنسبة 25% على الفئات المرئية و96% على الفئات الجديدة في مجموعة بيانات ImageNet.

التعلم شبه المشرف في العالم المفتوح | أحدث الأوراق البحثية | HyperAI