HyperAIHyperAI
il y a 11 jours

Regroupement ensembliste fondé sur les preuves extraites à partir de la matrice de co-association

Résumé

Le modèle d’accumulation de preuves est une approche visant à collecter les informations provenant des partitions de base dans une méthode d’ensemble de regroupement (clustering ensemble), et peut être considéré comme une transformation noyau passant de l’espace de données original vers une matrice de co-association. Toutefois, certaines informations relatives à la structure des clusters peuvent être partiellement perdues au cours de cette transformation ; par conséquent, certaines méthodes proposées dans la littérature tentent de récupérer ces informations perdues et de les réintroduire dans le processus d’ensemble. Dans cet article, un phénomène intéressant est mis en évidence : supprimer certaines preuves de la matrice de co-association peut conduire à des résultats de regroupement plus précis. L’explication intuitive de ce phénomène est que certaines preuves présentes dans la matrice de co-association originale peuvent constituer du bruit, ayant un effet négatif sur le regroupement final. Toutefois, il est difficile en pratique de détecter ces preuves, encore moins de les éliminer de la matrice. Pour pallier ce problème, nous proposons d’éliminer les preuves à plusieurs niveaux présentant une faible fréquence d’apparition, car les preuves négatives ne se produisent généralement pas de manière régulière dans les partitions de base. Ensuite, nous utilisons la méthode du normalized cut pour obtenir plusieurs résultats de regroupement. Afin de sélectionner le meilleur résultat d’ensemble, un indice de validité interne, spécifiquement conçu pour fonctionner uniquement à partir de la matrice de co-association, est introduit. Les résultats expérimentaux sur 16 jeux de données montrent que la méthode proposée surpasse certaines approches d’ensemble de regroupement de pointe.

Regroupement ensembliste fondé sur les preuves extraites à partir de la matrice de co-association | Articles de recherche récents | HyperAI