AutoGluon-Tabular: أوتوماتيكية موثوقة ودقيقة لـ AutoML للبيانات الهيكلية

نُقدِّم AutoGluon-Tabular، إطار عمل مفتوح المصدر للـ AutoML يتطلب فقط سطرًا واحدًا من لغة بايثون لتدريب نماذج تعلم آلي دقيقة للغاية على بيانات جدولية غير معالجة، مثل ملفات CSV. على عكس الإطارات الحالية للـ AutoML التي تركز بشكل رئيسي على اختيار النماذج أو القيم المثلى للبارامترات، يُحقّق AutoGluon-Tabular نجاحه من خلال دمج عدة نماذج وتجميعها في طبقات متعددة. تُظهر التجارب أن التجميع متعدد الطبقات لعدد كبير من النماذج يُستخدم الوقت المُخصَّص للتدريب بشكل أفضل من محاولة العثور على النموذج الأفضل وحيدًا. المساهمة الثانية تتمثل في تقييم شامل للمنصات التجارية والعلمية للـ AutoML، تشمل TPOT، H2O، AutoWEKA، auto-sklearn، AutoGluon، وGoogle AutoML Tables. أظهرت الاختبارات التي أُجريت على مجموعة مكونة من 50 مهمة تصنيف وانحدار من منصتي Kaggle وOpenML AutoML Benchmark أن AutoGluon أسرع، وأكثر موثوقية، وأكثر دقةً بكثير. ووجدنا أن AutoGluon غالبًا ما يتفوّق على أفضل تجميع ممكن من جميع منافسيه، حتى بعد معرفة النتائج النهائية. وفي مسابقتين شهيرتين على Kaggle، تفوّق AutoGluon على 99% من علماء البيانات المشاركين بعد مجرد 4 ساعات من التدريب على البيانات الخام.