Analyse von Kepler Objects of Interest mittels Machine Learning zur Exoplaneten-Identifikation
Seit mehreren Jahrzehnten erfolgte die Identifizierung von Planeten ausschließlich durch astronomische Experten und Forscher mit Hilfe spezialisierter Geräte. Mit dem Aufkommen rechnergestützter Methoden und dem Zugang zu Satellitendaten aus Weltraummissionen hat sich dieser Trend jedoch gewandelt. So hat beispielsweise das Exoplanet Exploration-Programm der NASA uns umfangreiche Datensätze über himmlische Objekte zur Verfügung gestellt, die die Erforschung des Weltraums unterstützen. Eine besonders interessante Mission ist die Kepler-Mission. Seit ihrem Beginn im Jahr 2007 wurden über 4000 transiterende Exoplaneten identifiziert. Sie hat uns eine umfassende Datenbank von Entdeckungen bereitgestellt, die zur Berechnung der Planetenhäufigkeitsraten in Abhängigkeit von Objektparametern wie Größe, Bestrahlungsfluss, Sternentyp und Umlaufperiode genutzt werden können. Diese Informationen sind im Cumulative Kepler Object of Information-Datensatz dokumentiert. Es wurden vier grundlegende Modelle miteinander verglichen: Support Vector Machines, Random Forest Classifiers, AdaBoost und Deep Neural Networks. Der AdaBoost-Klassifikator erwies sich als das optimale maschinelle Lernmodell und erreichte ein F-1-Score von 0,98.