Command Palette
Search for a command to run...
OpenLDN: تعلم اكتشاف فئات جديدة للتعلم شبه المشرف في العالم المفتوح
OpenLDN: تعلم اكتشاف فئات جديدة للتعلم شبه المشرف في العالم المفتوح
Mamshad Nayeem Rizve Navid Kardan Salman Khan Fahad Shahbaz Khan Mubarak Shah
الملخص
التعلم شبه المشرف (SSL) هو أحد النهج الرئيسية لمعالجة مشكلة التسمية في التعلم المشرف. يمكن للطرق الحديثة للتعلم شبه المشرف أن تستفيد بشكل فعال من مستودع كبير من البيانات غير المصنفة لتحسين الأداء مع الاعتماد على مجموعة صغيرة من البيانات المصنفة. يفترض معظم طرق SSL بشكل عام أن البيانات المصنفة وغير المصنفة تأتي من نفس التوزيع الإحصائي للبيانات. ومع ذلك، فإن هذا الافتراض نادرًا ما يكون صحيحًا في العديد من السيناريوهات الواقعية، مما يحد من قابلية تطبيق هذه الطرق. في هذا العمل، بدلاً من ذلك، نحاول حل مشكلة التعلم شبه المشرف في العالم المفتوح (open-world SSL) التي لا تعتمد على مثل هذا الافتراض. في مشكلة التعلم شبه المشرف في العالم المفتوح، الهدف هو تحديد عينات الفئات المعروفة، وفي الوقت نفسه اكتشاف وتجميع العينات التي تنتمي إلى فئات جديدة موجودة في البيانات غير المصنفة. يقدم هذا العمل نظام OpenLDN الذي يستخدم خسارة الشبه الثنائية (pairwise similarity loss) لاكتشاف الفئات الجديدة. باستخدام قاعدة الأمثلية ثنائية المستوى، تستغل خسارة الشبه الثنائية المعلومات المتاحة في مجموعة البيانات المصنفة لتجميع العينات من الفئات الجديدة ضمنياً، بينما تقوم بتحديد عينات الفئات المعروفة في الوقت نفسه. بعد اكتشاف الفئات الجديدة، يقوم OpenLDN بتحويل مشكلة التعلم شبه المشرف في العالم المفتوح إلى مشكلة تعلم شبه مشرف قياسية لتحقيق مكاسب أداء إضافية باستخدام طرق SSL الحالية. تظهر التجارب الواسعة لدينا أن OpenLDN يتفوق على أفضل الطرق الحالية في تصنيف العديد من المقاييس الشائعة بينما يوفر توازنًا أفضل بين الدقة ووقت التدريب.