HyperAIHyperAI
il y a 18 jours

DeepMol : un cadre automatisé d'apprentissage automatique et d'apprentissage profond pour la chimie computationnelle

{Miguel Rocha, João Capela, João Correia}
Résumé

Le domaine de la chimie computationnelle a connu une évolution significative grâce à l’introduction des technologies d’apprentissage automatique (Machine Learning, ML). Malgré son potentiel révolutionnaire, les chercheurs sont souvent confrontés à des obstacles tels que la complexité du choix d’algorithmes optimaux, l’automatisation des étapes de prétraitement des données, la nécessité d’une ingénierie de caractéristiques adaptative, ainsi que la garantie d’une cohérence de performance des modèles sur différentes bases de données. Face à ces défis, DeepMol se distingue comme un outil d’apprentissage automatique automatisé (AutoML) en automatisant les étapes cruciales du pipeline d’apprentissage automatique. DeepMol identifie rapidement et automatiquement la représentation de données, les méthodes de prétraitement et les configurations de modèle les plus efficaces pour un problème spécifique de prédiction de propriétés ou d’activité moléculaires. Sur 22 jeux de données de référence, DeepMol a obtenu des pipelines compétitifs par rapport à ceux nécessitant des processus longs et coûteux en temps, tels que l’ingénierie de caractéristiques, la conception et la sélection de modèles. En tant qu’un des premiers outils AutoML spécifiquement conçus pour le domaine de la chimie computationnelle, DeepMol se démarque par son code open source, ses tutoriels approfondis, sa documentation détaillée et des exemples d’applications réelles, tous disponibles à l’adresse suivante : https://github.com/BioSystemsUM/DeepMol et https://deepmol.readthedocs.io/en/latest/. En introduisant l’AutoML comme fonctionnalité innovante dans la chimie computationnelle, DeepMol s’impose comme l’outil de pointe pionnier dans ce domaine.