التجميع التبايني

في هذه الورقة، نقترح طريقة تجميع آنية في مرحلة واحدة تُسمى التجميع التبايني (CC)، والتي تقوم بشكل صريح بتعلم التباين على مستوى العناصر (instance-level) وعلى مستوى المجموعات (cluster-level). وبشكل محدد، بالنسبة لمجموعة بيانات معينة، يتم بناء أزواج العناصر الموجبة والسالبة من خلال تطبيق عمليات تحسين البيانات (data augmentations)، ثم يتم تمريرها إلى فضاء ميزات. وفي هذا الفضاء، يُجرى التعلم التبايني على مستوى العناصر في الفضاء الصفّي، بينما يُجرى التعلم التبايني على مستوى المجموعات في الفضاء العمودي، وذلك من خلال تعظيم التشابه بين أزواج العناصر الموجبة وتقليل التشابه بين أزواج العناصر السالبة. وتكمن ملاحظتنا الأساسية في أن الصفوف لمصفوفة الميزات يمكن اعتبارها تسميات ناعمة (soft labels) للعناصر، وبالتالي يمكن اعتبار الأعمدة على أنها تمثيلات للمجموعات. وباستخدام التحسين المتزامن لخسارة التعلم التبايني على مستوى العناصر وعلى مستوى المجموعات، يتمكن النموذج من تعلم التمثيلات وتعيينات التجميع بشكل مشترك ومتسلسل (end-to-end). وأظهرت النتائج التجريبية الواسعة أن CC تتفوق بشكل ملحوظ على 17 طريقة تجميع تنافسية على ستة معايير صعبة للصور. وبشكل خاص، حققت CC قيمة NMI قدرها 0.705 (0.431) على مجموعة بيانات CIFAR-10 (CIFAR-100)، ما يمثل تحسنًا في الأداء يصل إلى 19٪ (39٪) مقارنة بأفضل نموذج أساسي.