Graphen-Rationalisierung mit umfeldbasierten Augmentierungen

Rationale wird als eine Teilmenge von Eingabefeatures definiert, die die Vorhersage durch maschinelle Lernmodelle am besten erklärt oder stützt. Die Identifikation von Rationale hat die Verallgemeinerungsfähigkeit und Interpretierbarkeit neuronaler Netze bei visuellen und sprachlichen Daten verbessert. In graphbasierten Anwendungen wie der Vorhersage von Molekül- und Polymer-Eigenschaften spielt die Identifikation repräsentativer Untergraphenstrukturen, sogenannter Graph-Rationale, eine entscheidende Rolle für die Leistungsfähigkeit von Graph Neural Networks. Bisherige Methoden zur Graph-Pooling und/oder Verteilungsintervention leiden unter dem Mangel an Beispielen, um optimale Graph-Rationale zu erlernen. In dieser Arbeit führen wir eine neue Augmentierungsoperation namens Umgebungsumschaltung ein, die automatisch virtuelle Datensätze generiert, um die Identifikation von Rationale zu verbessern. Wir stellen einen effizienten Rahmen vor, der eine Trennung von Rationale und Umgebung sowie eine Repräsentationslernung sowohl auf echten als auch auf augmentierten Beispielen in latenter Raumdarstellung durchführt, um die hohe Komplexität einer expliziten Graph-Decodierung und -Codierung zu vermeiden. Verglichen mit aktuellen Techniken zeigen Experimente auf sieben realen Moleküldatensätzen und vier Polymer-Datensätzen die Wirksamkeit und Effizienz des vorgeschlagenen, auf Augmentierung basierenden Rahmens für die Graph-Rationalisierung.