Apprentissage de métriques pour des résumés basés sur la persistance et applications à la classification de graphes

Récemment, une nouvelle méthodologie de représentation des caractéristiques et d'analyse des données basée sur un outil topologique appelé l'homologie persistante (et son résumé correspondant, le diagramme de persistance) commence à gagner en importance. Une série de méthodes ont été développées pour mapper un diagramme de persistance vers une représentation vectorielle afin de faciliter l'utilisation ultérieure d'outils d'apprentissage automatique, et dans ces approches, l'importance (poids) des différentes caractéristiques de persistance est souvent prédéfinie. Cependant, en pratique, le choix de la fonction de poids devrait dépendre de la nature du type spécifique de données que l'on considère, il est donc très souhaitable d'apprendre la meilleure fonction de poids (et ainsi la métrique pour les diagrammes de persistance) à partir de données étiquetées. Nous étudions ce problème et développons un nouveau noyau pondéré, appelé WKPI (Weighted Kernel for Persistence Information), pour les résumés de persistance, ainsi qu'un cadre d'optimisation pour apprendre une bonne métrique pour les résumés de persistance. Notre noyau et notre problème d'optimisation possèdent des propriétés intéressantes. Nous appliquons ensuite le noyau appris à la tâche complexe de classification des graphes, et montrons que notre cadre de classification basé sur WKPI obtient des résultats similaires ou (parfois significativement) meilleurs que les meilleurs résultats issus d'une gamme d'anciens cadres de classification des graphes sur une collection de jeux de données standards.