تحليل الكائنات المثيرة للاهتمام في كيبر (Kepler Objects of Interest) باستخدام التعلم الآلي لتحديد الكواكب الخارجية
على مدار عقود عديدة، كانت عملية تحديد الكواكب مقتصرة على الخبراء والباحثين الفلكيين باستخدام معدات متخصصة. ومع ظهور الأساليب الحاسوبية وتوفر بيانات الأقمار الصناعية من المهام الفضائية، تغير هذا الاتجاه. على سبيل المثال، قدم برنامج استكشاف الكواكب الخارجية التابع لناسا لنا كميات هائلة من البيانات المتعلقة بالكائنات السماوية لدعم استكشاف الفضاء. إحدى المهام التي تُعد ذات أهمية كبيرة هي مهمة كيبلر. فقد تم اكتشاف أكثر من 4000 كوكب خارج المجموعة الشمسية يمر عبر قرص نجمي منذ بدء المهمة في عام 2007. وقد وفرت هذه المهمة قاعدة بيانات شاملة للاكتشافات، تُستخدم في حساب معدلات وقوع الكواكب كدالة على معاملات الكائن مثل الحجم، وتدفق الإشعاع الشمسي، ونوع النجم، وفترة المدار. ويُوثق هذا المعلومات في مجموعة بيانات كيبلر التراكمية للكائنات المعرفة. تم مقارنة أربع نماذج أساسية، وهي: آلات المتجهات الداعمة (Support Vector Machines)، والتصنيف العشوائي (Random Forest Classifiers)، ونظام أدابوست (AdaBoost)، والشبكات العصبية العميقة (Deep Neural Networks). وتم اختيار نموذج التصنيف أدابوست كأفضل نموذج تعلم آلي، حيث حقق معدل دقة (F-1 Score) قدره 0.98.