Regroupement par Agrégation de Probabilités en Ligne Profonde

La combinaison de la classification automatique par machine avec des modèles profonds a montré une supériorité remarquable dans le domaine du clustering profond. Cette approche modifie le pipeline de traitement des données en deux phases alternées : la classification des caractéristiques et l'entraînement du modèle. Cependant, un tel calendrier alterné peut entraîner des problèmes d'instabilité et de charge computationnelle. Nous proposons un algorithme de clustering sans centre appelé Clustering par Agrégation de Probabilités (PAC) pour adapter proactivement les technologies d'apprentissage profond, facilitant ainsi leur déploiement dans le clustering profond en ligne. Le PAC évite l'utilisation des centres de clusters et aligne les espaces probabiliste et distributionnel en formulant le clustering comme un problème d'optimisation avec une nouvelle fonction objectif. Sur la base du mécanisme de calcul du PAC, nous proposons un module général d'agrégation de probabilités en ligne pour effectuer une classification stable et flexible des caractéristiques sur des mini-lots de données, et construisons un cadre de clustering visuel profond appelé Deep PAC (DPAC). De nombreuses expériences montrent que le PAC possède une robustesse et des performances supérieures en clustering, tandis que le DPAC surpasse considérablement les méthodes actuelles les plus avancées en clustering profond.