التحليل التصنيفي المعنى غير المراقب على نطاق واسع

بفضل المجموعات الكبيرة من البيانات، مثل ImageNet، أتاح التعلم غير المراقب على البيانات على نطاق واسع تقدمًا كبيرًا في المهام التصنيفية. ومع ذلك، لا يزال غير معروف ما إذا كان من الممكن تحقيق التجزئة الدلالية غير المراقبة على نطاق واسع. تتمثل التحديات الرئيسية في: (أ) الحاجة إلى معيار كبير لقياس أداء الخوارزميات؛ و(ب) الحاجة إلى تطوير طرق تتعلم تمثيلات الفئة والشكل معًا بطريقة غير مراقبة في آن واحد. في هذا العمل، نقترح مشكلة جديدة تُعرف بـ "التجزئة الدلالية غير المراقبة على نطاق واسع" (LUSS)، مع معيار جديد مُنشأ من مجموعة بيانات لدعم تقدم البحث. مستندين إلى مجموعة بيانات ImageNet، نقدم مجموعة بيانات ImageNet-S التي تحتوي على 1.2 مليون صورة تدريبية و50 ألف تسمية تجزئة دلالية عالية الجودة لتقييم الأداء. يتميز معيارنا بتنوع عالٍ في البيانات ووضوح في هدف المهمة. كما نقدم طريقة بسيطة ولكن فعالة حقًا، أظهرت أداءً مدهشًا في مهام LUSS. بالإضافة إلى ذلك، نقوم بمقارنة منهجية للطرق ذات الصلة المُراقبة وغير المراقبة، والضعيفة والمُراقبة بالكامل، مما يُساعد في تحديد التحديات والاتجاهات المحتملة في مجال LUSS. يُتاح المعيار والكود المصدري بشكل عام عبر الرابط: https://github.com/LUSSeg.