Command Palette
Search for a command to run...
Molecular Topological Profile (MOLTOP) – Einfacher und starker Baseline für die Molekülgaph-Klassifikation
Molecular Topological Profile (MOLTOP) – Einfacher und starker Baseline für die Molekülgaph-Klassifikation
Wojciech Czech Jakub Adamczyk
Zusammenfassung
Wir untersuchen erneut die Wirksamkeit topologischer Deskriptoren für die Klassifikation molekularer Graphen und entwickeln eine einfache, dennoch leistungsstarke Baseline. Wir zeigen, dass ein einfacher Ansatz zur Merkmalsingenieurarbeit – die Histogrammaggregation von Kanten-Deskriptoren kombiniert mit One-Hot-Codierung für Atomzahlen und Bindungstypen – in Kombination mit einem Random Forest-Klassifikator eine starke Basis für Graph Neural Networks (GNNs) darstellt. Der neuartige Algorithmus Molecular Topological Profile (MOLTOP) integriert die Edge Betweenness Centrality, den Adjusted Rand Index und die SCAN-Strukturelle Ähnlichkeitsmessung. Dieser Ansatz erweist sich als bemerkenswert konkurrenzfähig gegenüber modernen GNNs, gleichzeitig ist er einfach, schnell, varianzarm und hyperparameterfrei. Unsere Methode wird rigoros an den MoleculeNet-Datensätzen evaluiert, wobei ein fairen Evaluationsprotokoll des Open Graph Benchmark verwendet wird. Zudem zeigen wir Fähigkeiten zur Out-of-Domain-Generierung im Kontext der Peptid-Klassifikation aus dem Long Range Graph Benchmark. Die Bewertungen über elf Benchmark-Datensätze offenbaren die starke diskriminierende Leistungsfähigkeit von MOLTOP, die sogar die 1-WL- und in einigen Graphenklassen die 3-WL-Testgrenze übertreffen. Unser Fazit lautet: deskriptorbasierte Baselines, wie die von uns vorgeschlagene, bleiben weiterhin entscheidend für die präzise Beurteilung von Fortschritten im GNN-Bereich.