دعم التجميع بالتعلم التبايني

التصنيف غير المشرف يهدف إلى اكتشاف فئات المعنى للبيانات وفقًا لبعض المقاييس المسافة في الفضاء التمثيلي. ومع ذلك، غالبًا ما تتداخل الفئات المختلفة مع بعضها البعض في الفضاء التمثيلي في بداية عملية التعلم، مما يشكل تحديًا كبيرًا أمام التصنيف القائم على المسافة لتحقيق فصل جيد بين الفئات المختلفة. من أجل هذا، نقترح إطار العمل "دعم التجميع بالتعلم المقارن" (SCCL) -- وهو إطار جديد يستخدم التعلم المقارن لتعزيز الفصل الأفضل. نقيم أداء SCCL في تجميع النصوص القصيرة ونظهر أن SCCL يحقق تقدمًا كبيرًا على النتائج الحالية في معظم مجموعات البيانات القياسية، بتحسين بنسبة 3٪-11٪ في الدقة و4٪-15٪ في المعلومات المتبادلة المُعَدَّلَة. علاوة على ذلك، تُبيِّن تحليلنا الكمي فعالية SCCL في الاستفادة من قوى كل من تمييز الحالات من الأسفل إلى الأعلى والتصنيف من الأعلى إلى الأسفل لتحقيق مسافات أفضل داخل الفئات وبين الفئات عند تقييمها باستخدام علامات الفئات الحقيقية.