HyperAIHyperAI
vor einem Monat

N-Gram-Graph: Einfache unüberwachte Darstellung für Graphen mit Anwendungen auf Moleküle

Shengchao Liu; Mehmet Furkan Demirel; Yingyu Liang
N-Gram-Graph: Einfache unüberwachte Darstellung für Graphen mit Anwendungen auf Moleküle
Abstract

Maschinelles Lernen wird in jüngster Zeit in verschiedenen Anwendungen der Medizin, Biologie, Chemie und Materialwissenschaft eingesetzt. Eine wichtige Aufgabe ist die Vorhersage von Eigenschaften von Molekülen, die als Hauptunterprogramm in vielen nachgelagerten Anwendungen wie virtuellem Screening und Arzneimittelentwicklung dient. Trotz des wachsenden Interesses stellt die Konstruktion geeigneter Repräsentationen von Molekülen für Lernalgorithmen eine wesentliche Herausforderung dar. In dieser Arbeit wird das N-Gram-Graph eingeführt, eine einfache unüberwachte Repräsentation für Moleküle. Die Methode kodiert zunächst die Knoten im Molekülgraph. Anschließend erstellt sie eine kompakte Repräsentation des Graphen, indem sie die Knoteneinbettungen in kurzen Wegen im Graphen zusammenfügt, was wir als äquivalent zu einem einfachen Graph-Neuralnetz zeigen, das keine Trainingsschritte benötigt. Die Repräsentationen können daher effizient berechnet werden und dann mit überwachten Lernmethoden zur Vorhersage verwendet werden. Experimente anhand von 60 Aufgaben aus 10 Benchmark-Datensätzen demonstrieren ihre Vorteile gegenüber sowohl beliebten Graph-Neuralnetzen als auch traditionellen Repräsentationsmethoden. Dies wird durch eine theoretische Analyse ergänzt, die ihre starke Repräsentations- und Vorhersagekraft zeigt.