Vorhersage von ADMET-Eigenschaften durch Kombinationen molekularer Fingerabdrücke

Bei der Untersuchung von Methoden zur Vorhersage der Potenz von kleinen Molekülen fanden wir heraus, dass Random Forests oder Support Vector Machines in Verbindung mit erweiterten Konnektivitätsfingerprint (ECFP) konsistent neuerlich entwickelte Methoden übertrafen. Eine detaillierte Analyse von Regressionsalgorithmen und molekularen Fingerprint zeigte, dass gradientenbasierte Entscheidungsbäume, insbesondere CatBoost, in Kombination mit einer Mischung aus ECFP, Avalon und ErG Fingerprint sowie 200 molekularen Eigenschaften am effektivsten waren. Die Einbeziehung eines Graph Neural Network Fingerprint verbesserte die Leistung weiter. Wir konnten unser Modell erfolgreich an 22 Benchmarks des Therapeutics Data Commons ADMET validieren. Unsere Ergebnisse unterstreichen die Bedeutung reichhaltigerer molekularer Darstellungen für genaue Eigenschaftsvorhersagen.