Prédiction des propriétés ADMET par combinaisons d'empreintes moléculaires

Lors de l'investigation des méthodes permettant de prédire les puissances des petites molécules, nous avons constaté que les forêts aléatoires ou les machines à vecteurs de support associées aux empreintes digitales d'extensibilité connectivité (ECFP) surpassaient systématiquement les méthodes récemment développées. Une enquête détaillée sur les algorithmes de régression et les empreintes digitales moléculaires a révélé que les arbres de décision boostés par gradient, en particulier CatBoost, conjugués à une combinaison d'empreintes digitales ECFP, Avalon et ErG, ainsi qu'à 200 propriétés moléculaires, se sont avérés être les plus efficaces. L'intégration d'une empreinte digitale issue des réseaux neuronaux graphiques a encore amélioré les performances. Nous avons validé avec succès notre modèle sur 22 benchmarks ADMET du Therapeutics Data Commons. Nos résultats soulignent l'importance des représentations moléculaires plus riches pour une prédiction précise des propriétés.