Lernmetriken für persistenzbasierte Zusammenfassungen und Anwendungen zur Graphklassifizierung

Kürzlich hat eine neue Merkmalsrepräsentation und Datenanalysemethode, die auf einem topologischen Werkzeug namens persistente Homologie (und ihrem entsprechenden Persistenzdiagramm-Zusammenfassung) basiert, an Dynamik gewonnen. Eine Reihe von Methoden wurde entwickelt, um ein Persistenzdiagramm in eine Vektordarstellung abzubilden, um den Einsatz von maschinellen Lernverfahren im Nachgang zu erleichtern. In diesen Ansätzen werden die Bedeutungen (Gewichte) verschiedener Persistenzmerkmale oft vorgegeben. In der Praxis sollte jedoch die Wahl der Gewichtsfunktion in der Regel von der Natur der betrachteten Datenart abhängen, weshalb es äußerst wünschenswert ist, aus etikettierten Daten eine optimale Gewichtsfunktion (und damit auch Metrik für Persistenzdiagramme) zu lernen. Wir untersuchen dieses Problem und entwickeln einen neuen gewichteten Kern, genannt WKPI (Weighted Kernel for Persistence Information), für Persistenzzusammenfassungen sowie ein Optimierungsrahmenwerk zur Lern einer guten Metrik für Persistenzzusammenfassungen. Sowohl unser Kern als auch unser Optimierungsproblem weisen gute Eigenschaften auf. Wir wenden den gelernten Kern anschließend auf die anspruchsvolle Aufgabe der Graphklassifikation an und zeigen, dass unser WKPI-basierter Klassifikationsrahmenwerk vergleichbare oder (manchmal erheblich) bessere Ergebnisse als die besten Ergebnisse einer Reihe vorheriger Graphklassifikationsrahmenwerke auf einer Sammlung von Benchmark-Datensätzen erzielt.