HyperAIHyperAI
il y a 2 mois

Architecture de deep learning multi-entrée basée sur l'attention pour la prédiction d'activité biologique : une application aux inhibiteurs de l'EGFR

Huy Ngoc Pham; Trung Hoang Le
Architecture de deep learning multi-entrée basée sur l'attention pour la prédiction d'activité biologique : une application aux inhibiteurs de l'EGFR
Résumé

L'apprentissage automatique (machine learning) et l'apprentissage profond (deep learning) ont connu une popularité croissante et obtenu un succès considérable dans la découverte de médicaments au cours des dernières décennies. Historiquement, les modèles d'apprentissage automatique et d'apprentissage profond étaient formés soit sur des données structurales, soit sur des propriétés chimiques, par des modèles séparés. Dans cette étude, nous proposons une architecture permettant de former simultanément ces deux types de données afin d'améliorer les performances globales. À partir de la structure moléculaire sous forme de notation SMILES et de leurs étiquettes, nous avons généré une matrice de caractéristiques basée sur SMILES et des descripteurs moléculaires. Ces données ont été formées à l'aide d'un modèle d'apprentissage profond intégrant également le mécanisme d'Attention pour faciliter la formation et l'interprétation. Les expériences ont montré que notre modèle pouvait améliorer les performances prédictives par rapport au modèle de référence. Avec un MCC maximal de 0,58 et un AUC de 90 % par validation croisée sur le jeu de données des inhibiteurs d'EGFR, notre architecture surpassait le modèle référentiel. Nous avons également réussi à intégrer le mécanisme d'Attention dans notre modèle, ce qui a aidé à interpréter la contribution des structures chimiques à l'activité biologique.

Architecture de deep learning multi-entrée basée sur l'attention pour la prédiction d'activité biologique : une application aux inhibiteurs de l'EGFR | Articles de recherche récents | HyperAI