التصنيف العمقي للصور استنادًا إلى الكثافة

في الآونة الأخيرة، حققت تقنيات التجميع العميق، التي تتمكن من تعلم الخصائص المفضلة لمهام التجميع عبر الشبكات العصبية العميقة، أداءً ملحوظًا في تطبيقات تجميع الصور. ومع ذلك، فإن خوارزميات التجميع العميقة الحالية تحتاج عمومًا إلى معرفة عدد المجموعات مسبقًا، وهو ما يكون غير معروف عادةً في المهام الحقيقية. بالإضافة إلى ذلك، يتم إنشاء المراكز الأولية للمجموعات في الفضاء الخاص بالخصائص المُتعلمة بواسطة خوارزمية $k$-means. هذا الأسلوب يعمل بشكل جيد فقط على المجموعات الكروية وقد يؤدي إلى نتائج تجميع غير مستقرة. في هذا البحث، نقترح إطارًا ذو مرحلتين للتجميع الكثيف القائم على الصور (DDC) لمعالجة هذه المشكلات. المرحلة الأولى هي تدريب مُشفِّر ذاتي اتفاقي عمقي (CAE) لاستخراج تمثيلات خصائص ذات بُعد منخفض من بيانات الصور ذات البُعد العالي، ثم تطبيق تقنية t-SNE لتقليل البيانات إلى فضاء ثنائي الأبعاد يفضل الخوارزميات القائمة على الكثافة. المرحلة الثانية هي تطبيق التقنية الكثيفة للتجميع التي تم تطويرها على البيانات المرتبطة ثنائية الأبعاد لاكتشاف عدد مجموعات مناسب بشكل آلي ولديها أشكال متعددة. بالتحديد، يتم إنشاء العديد من المجموعات المحلية لالتقاط الهياكل المحلية للمجموعات، ومن ثم دمجها عبر علاقتها بالكثافة للحصول على النتيجة النهائية للتجميع. تظهر التجارب أن الإطار المقترح DDC يحقق أداءً في التجميع مماثلاً أو حتى أفضل من طرق التجميع العميقة الأكثر حداثة، حتى عندما لا يتم تقديم عدد المجموعات.