Analyse des objets d'intérêt Kepler à l'aide de l'apprentissage automatique pour l'identification des exoplanètes
Pendant plusieurs décennies, l’identification des planètes n’a été réalisée que par des experts astronomiques et des chercheurs, à l’aide d’équipements spécialisés. Avec l’avènement des méthodes computationnelles et l’accès aux données satellitaires provenant de missions spatiales, cette tendance a évolué. Par exemple, le programme d’exploration des exoplanètes de la NASA nous a fourni d’immenses quantités de données sur des objets célestes, afin d’appuyer l’exploration spatiale. Une telle mission d’intérêt est la mission Kepler. Depuis son lancement en 2007, plus de 4 000 exoplanètes transitoires ont été identifiées. Cette mission a permis de constituer une base de données étendue, servant au calcul des taux d’apparition des planètes en fonction de paramètres tels que la taille, le flux d’insolation, le type d’étoile et la période orbitale. Ces informations sont répertoriées dans le jeu de données Cumulative Kepler Object of Information. Quatre modèles fondamentaux ont été comparés : les Machines à vecteurs de support (Support Vector Machines), les Classificateurs par forêt aléatoire (Random Forest Classifiers), AdaBoost et les Réseaux de neurones profonds (Deep Neural Networks). Le classificateur AdaBoost a été retenu comme le modèle d’apprentissage automatique optimal, atteignant un score F-1 de 0,98.