التعلم الذاتي المُوازن للنماذج التوليدية المُتعددة التجميع

التكعيّم يُعدّ مشكلة مهمة في العديد من تطبيقات التعلم الآلي، لكنه ما يزال يمثل مهمة صعبة عند التعامل مع البيانات الحقيقية المعقدة. تعتمد الخوارزميات الحالية للتكعيّم إما على نماذج سطحية ذات قدرة غير كافية لالتقاط الطبيعة غير الخطية للبيانات، أو على نماذج عميقة تحتوي على عدد كبير من المعاملات، مما يجعلها عرضة للانحدار الزائد (overfitting). في هذه الورقة، نقترح شبكة تكعيّم متعددة الطبقات تعتمد على التفاعل التوليدية المُعاكسة (Deep Generative Adversarial Clustering Network، وتعتبرها ClusterGAN)، والتي تعالج تحديات تدريب نماذج التكعيّم العميقة بطريقة غير مراقبة. تتكوّن ClusterGAN من ثلاث شبكات: مُميّز (discriminator)، ومُولِّد (generator)، ومركب تكعيّم (clusterer)، أي شبكة تكعيّم. نستخدم لعبة مُعاكسة بين هذه اللاعب الثلاثة لتكوين عينات واقعية باستخدام متغيرات مُستقلة تمييزية من خلال المُولِّد، وتعلم التماثل العكسي للعينات الحقيقية إلى فضاء التضمين التمييزي من خلال المُركب التكعيّمي. علاوة على ذلك، نستخدم دالة خسارة تقليل الانتروبيا الشرطية لزيادة أو تقليل التشابه بين العينات داخل الكتلة أو بين الكتل المختلفة. وبما أن التشابه الحقيقي غير معروف في مهام التكعيّم، نقترح خوارزمية تعلم ذاتية متوازنة ومتدرجة (balanced self-paced learning) جديدة، تُدرج العينات تدريجيًا في التدريب من الأسهل إلى الأصعب، مع أخذ التنوّع بين العينات المختارة من جميع الكتل بعين الاعتبار. وبالتالي، تُمكّن طريقتنا من تدريب مُركبات تكعيّم ذات عمق كبير بكفاءة، من خلال الاستفادة من اللعبة المُعاكسة المقترحة وخوارزمية التعلم الذاتي المتوازن. ووفقًا لتجاربنا، تحقق ClusterGAN نتائج تنافسية مقارنةً بأساليب التكعيّم والهششة (hashing) الرائدة في مجالها على عدة مجموعات بيانات.