Un cadre universel pour l'apprentissage profond géométrique précis et efficace des systèmes moléculaires

Les sciences moléculaires abordent une large gamme de problèmes impliquant des molécules de types et de tailles diverses, ainsi que leurs complexes. Récemment, l’apprentissage profond géométrique, en particulier les réseaux de neurones sur graphes (Graph Neural Networks), a démontré des performances prometteuses dans des applications des sciences moléculaires. Toutefois, la plupart des travaux existants imposent souvent des biais inductifs ciblés à un système moléculaire spécifique, ce qui les rend peu efficaces lorsqu’ils sont appliqués à des macromolécules ou à des tâches à grande échelle, limitant ainsi leur utilisation dans de nombreux problèmes réels. Pour relever ces défis, nous proposons PAMNet, un cadre universel permettant d’apprendre avec précision et efficacité les représentations de molécules tridimensionnelles (3D) de tailles et de types variés, dans tout type de système moléculaire. Inspiré par la mécanique moléculaire, PAMNet intègre un biais guidé par la physique afin de modéliser explicitement les interactions locales et non locales, ainsi que leurs effets combinés. En conséquence, PAMNet permet de réduire les opérations coûteuses, rendant ainsi l’approche à la fois plus rapide et plus économique en mémoire. Dans des études d’évaluation étendues, PAMNet surpasse les meilleures méthodes existantes en termes de précision et d’efficacité sur trois tâches d’apprentissage distinctes : propriétés de petites molécules, structures 3D d’ARN, et affinités de liaison protéine-ligand. Nos résultats mettent en évidence le potentiel de PAMNet dans un large éventail d’applications des sciences moléculaires.