MT-CGCNN : Intégration du réseau neuronal convolutif graphique cristallin avec l'apprentissage multitâche pour la prédiction des propriétés des matériaux

Le développement de modèles d'apprentissage automatique précis, transférables et peu coûteux en termes de calcul peut accélérer rapidement la découverte et le développement de nouveaux matériaux. Parmi les principaux défis liés au développement de tels modèles figurent : (i) la disponibilité limitée des données sur les matériaux par rapport à d'autres domaines, (ii) l'absence de descripteur universel des matériaux pour prédire leurs différentes propriétés. La disponibilité limitée des données sur les matériaux peut être résolue grâce à l'apprentissage par transfert, tandis que la représentation générique a été récemment abordée par Xie et Grossman [1], où ils ont développé un réseau neuronal convolutif sur graphes cristallins (CGCNN) qui fournit une représentation unifiée des cristaux. Dans ce travail, nous développons un nouveau modèle (MT-CGCNN) en intégrant le CGCNN avec l'apprentissage par transfert basé sur l'apprentissage multi-tâches (MT). Nous démontrons l'efficacité du MT-CGCNN par la prédiction simultanée de diverses propriétés de matériaux, telles que l'énergie de formation, l'écart interbande et l'énergie de Fermi, pour une large gamme de cristaux inorganiques (46 774 matériaux). Le MT-CGCNN est capable de réduire l'erreur de test jusqu'à 8 % lorsqu'il est appliqué à des propriétés corrélées. Les prédictions du modèle présentent une erreur de test plus faible que celle du CGCNN, même lorsque les données d'entraînement sont réduites de 10 %. Nous démontrons également les meilleures performances de notre modèle grâce à la prédiction d'un scénario lié à la classification métal/non-métal. Ces résultats encouragent le développement ultérieur d'approches d'apprentissage automatique qui exploitent l'apprentissage multi-tâches pour relever les défis mentionnés dans la découverte de nouveaux matériaux. Nous mettons le code source du MT-CGCNN à disposition pour encourager une recherche reproductible.