Noyau de Wasserstein tronqué pour les diagrammes de persistance

Les diagrammes de persistance (PDs) jouent un rôle crucial dans l'analyse topologique des données (TDA), où ils sont couramment utilisés pour décrire les propriétés topologiques de formes complexes. Les PDs bénéficient de propriétés de stabilité robustes et ont fait leurs preuves dans divers contextes d'apprentissage. Cependant, ils ne résident pas dans un espace naturellement doté d'une structure hilbertienne et sont généralement comparés à l'aide de distances spécifiques, telles que la distance bottleneck. Pour intégrer les PDs dans une chaîne de traitement d'apprentissage, plusieurs noyaux ont été proposés pour les PDs, avec une attention particulière portée à la stabilité de la distance RKHS par rapport aux perturbations des PDs. Dans cet article, nous utilisons l'approximation tranchée de la distance de Wasserstein, appelée SW, pour définir un nouveau noyau pour les PDs, qui non seulement est prouvément stable mais aussi prouvément discriminant (en fonction du nombre de points dans les PDs) par rapport à la distance de Wasserstein (d_1) entre les PDs. Nous démontrons également sa praticité en développant une technique d'approximation pour réduire le temps de calcul du noyau et montrons que notre proposition se compare favorablement aux noyaux existants pour les PDs sur plusieurs benchmarks.