Découverte de médicaments à faible données avec l'apprentissage par un seul exemple

Les progrès récents en apprentissage automatique ont apporté des contributions significatives à la découverte de médicaments. En particulier, les réseaux neuronaux profonds ont démontré leur capacité à améliorer considérablement la puissance prédictive lorsqu'il s'agit d'inférer les propriétés et les activités des composés de petite taille. Cependant, l'application de ces techniques a été limitée par le besoin de grandes quantités de données d'entraînement. Dans cette étude, nous montrons comment l'apprentissage par un seul exemple (one-shot learning) peut être utilisé pour réduire considérablement les volumes de données nécessaires pour faire des prédictions pertinentes dans les applications de découverte de médicaments. Nous présentons une nouvelle architecture, l'embedding LSTM résiduel, qui, lorsqu'elle est combinée avec des réseaux neuronaux convolutionnels sur graphes, améliore considérablement la capacité d'apprendre des métriques de distance significatives sur les molécules de petite taille. Nous mettons à disposition sous licence open source tous les modèles introduits dans cette étude au sein de DeepChem, un cadre open source dédié à l'apprentissage profond en découverte de médicaments.