HyperAIHyperAI
منذ 17 أيام

تخفيف عدم التوافق بين التضمين وتخصيص الفئة في التصنيف الصوتي للصور

{Sungwon Park, Sungwon Han, Sungkyu Park, Sundong Kim, Meeyoung Cha}
تخفيف عدم التوافق بين التضمين وتخصيص الفئة في التصنيف الصوتي للصور
الملخص

التصنيف غير المُراقب للصور يُعد مهمة صعبة في مجال رؤية الحاسوب. وقد حققت الخوارزميات القائمة على التعلم العميق نتائج ممتازة، حيث تعتمد أحدث النهج على استخدام خسائر موحدة من عمليتي التضمين (embedding) وتخصيص الفئات (class assignment). وبما أن هاتين العمليتين تمتلكان أهدافًا مختلفة بطبيعتها، فإن تحسينهما معًا قد يؤدي إلى حل غير مثالي. وللتغلب على هذا التقييد، نقترح خوارزمية جديدة على مرحلتين، حيث يسبق وحدة تضمين للتدريب المسبق وحدة تحسينية تقوم بتنفيذ العمليات التضمينية وتخصيص الفئات في آنٍ واحد. وقد أظهر نموذجنا تفوقًا على أحدث النماذج (SOTA) عند اختباره على عدة مجموعات بيانات، حيث حقق دقة عالية جدًا تبلغ 81.0% على مجموعة بيانات CIFAR-10 (أي زيادة قدرها 19.3 نقطة مئوية)، و35.3% على CIFAR-100-20 (9.6 نقطة مئوية)، و66.5% على STL-10 (6.9 نقطة مئوية) في المهام غير المُراقبة.

تخفيف عدم التوافق بين التضمين وتخصيص الفئة في التصنيف الصوتي للصور | أحدث الأوراق البحثية | HyperAI