تعلم التمثيل البصري غير المشرف عبر ك-ميونز المقيد عبر الإنترنت

تمييز المجموعات هو مهمة مسبقة فعالة للتعلم التمثيلي غير المشرف، والذي يتألف عادةً من مرحلتين: تجميع البيانات وتمييزها. يتم في عملية التجميع تعيين كل حالة بعلامة زائفة سيتم استخدامها لتعلم التمثيلات في عملية التمييز. تحدي رئيسي يكمن في عملية التجميع نظرًا لأن الطرق السائدة للتجميع (مثل k-means) يجب أن تعمل في وضع الدفعة. بالإضافة إلى ذلك، يمكن أن يكون هناك حل بسيط يتكون من مجموعة سائدة. لمعالجة هذه التحديات، قمنا أولاً بالتحقيق في هدف تعلم التمثيل القائم على التجميع. بناءً على هذا، اقترحنا مهمة مسبقة جديدة قائمة على التجميع مع k-means مقيد عبر الإنترنت (CoKe). بالمقارنة مع طرق التجميع المتوازنة التي تكون فيها حجم كل مجموعة متطابقًا تمامًا، نحن فقط نقيد الحجم الأدنى لكل مجموعة لالتقاط البنية الداخلية للبيانات بشكل مرن. وأكثر أهمية من ذلك، فإن طريقة تعييننا عبر الإنترنت لديها ضمان نظري للوصول إلى الأمثل العالمي. من خلال فصل عملية التجميع عن عملية التمييز، يمكن لـ CoKe تحقيق أداء تنافسي عند القيام بالتحسين باستخدام وجهة نظر واحدة فقط من كل حالة. تم إجراء تجارب واسعة النطاق على ImageNet وغيرها من مجموعات البيانات المرجعية التي أكدت كفاءة وفعالية مقترحنا. الرمز متاح على الرابط \url{https://github.com/idstcv/CoKe}.