Command Palette
Search for a command to run...
Profil topologique moléculaire (MOLTOP) – Base simple et puissante pour la classification des graphes moléculaires
Profil topologique moléculaire (MOLTOP) – Base simple et puissante pour la classification des graphes moléculaires
Wojciech Czech Jakub Adamczyk
Résumé
Nous réexaminons l'efficacité des descripteurs topologiques pour la classification des graphes moléculaires et proposons une base simple mais performante. Nous démontrons qu'une approche élémentaire d'ingénierie de caractéristiques — combinant une agrégation par histogramme des descripteurs d'arêtes et un encodage one-hot pour les numéros atomiques et les types de liaisons —, lorsqu'elle est couplée à un classificateur Random Forest, peut établir une base solide pour les réseaux de neurones sur graphes (GNN). L'algorithme novateur, appelé Molecular Topological Profile (MOLTOP), intègre la centralité par intermédiarité des arêtes, l'indice de Rand ajusté et le score de similarité structurelle SCAN. Cette méthode se révèle remarquablement compétitive par rapport aux GNN modernes, tout en étant simple, rapide, à faible variance et sans hyperparamètres. Notre approche est rigoureusement évaluée sur les jeux de données MoleculeNet, selon un protocole d'évaluation équitable fourni par Open Graph Benchmark. Nous montrons également sa capacité à générer des résultats hors domaine sur la tâche de classification des peptides, tirée du Long Range Graph Benchmark. Les évaluations menées sur onze jeux de données de référence révèlent une forte capacité discriminative de MOLTOP, dépassant même le test 1-WL et, dans certains cas, le test 3-WL. Nous concluons que les bases fondées sur des descripteurs, telles que celle que nous proposons, restent essentielles pour évaluer avec précision les progrès réalisés dans le domaine des GNN.