DiffDock : Étapes de diffusion, torsions et virages pour le docking moléculaire

La prédiction de la structure d' liaison d'un ligand moléculaire de petite taille à une protéine -- une tâche connue sous le nom de docking moléculaire -- est cruciale pour la conception de médicaments. Les méthodes récentes d'apprentissage profond qui traitent le docking comme un problème de régression ont réduit les temps d'exécution par rapport aux méthodes traditionnelles basées sur la recherche, mais n'ont pas encore offert des améliorations substantielles en termes de précision. Nous proposons plutôt de considérer le docking moléculaire comme un problème de modélisation générative et développons DiffDock, un modèle génératif par diffusion sur la variété non euclidienne des poses des ligands. Pour ce faire, nous cartographions cette variété dans l'espace produit des degrés de liberté (translation, rotation et torsion) impliqués dans le docking et élaborons un processus de diffusion efficace dans cet espace. Expérimentalement, DiffDock atteint un taux de réussite en tête-1 (RMSD < 2 Å) de 38 % sur PDBBind, surpassant significativement l'état de l'art précédent des méthodes traditionnelles (23 %) et d'apprentissage profond (20 %). De plus, alors que les méthodes précédentes ne sont pas capables d'effectuer du docking sur des structures pliées par calcul (précision maximale 10,4 %), DiffDock maintient une précision nettement supérieure (21,7 %). Enfin, DiffDock présente des temps d'inférence rapides et fournit des estimations de confiance avec une précision sélective élevée.