HyperAIHyperAI
منذ 9 أيام

AutoGluon-Tabular: أوتوماتيكية موثوقة ودقيقة لـ AutoML للبيانات الهيكلية

Nick Erickson, Jonas Mueller, Alexander Shirkov, Hang Zhang, Pedro Larroy, Mu Li, Alexander Smola
AutoGluon-Tabular: أوتوماتيكية موثوقة ودقيقة لـ AutoML للبيانات الهيكلية
الملخص

نُقدِّم AutoGluon-Tabular، إطار عمل مفتوح المصدر للـ AutoML يتطلب فقط سطرًا واحدًا من لغة بايثون لتدريب نماذج تعلم آلي دقيقة للغاية على بيانات جدولية غير معالجة، مثل ملفات CSV. على عكس الإطارات الحالية للـ AutoML التي تركز بشكل رئيسي على اختيار النماذج أو القيم المثلى للبارامترات، يُحقّق AutoGluon-Tabular نجاحه من خلال دمج عدة نماذج وتجميعها في طبقات متعددة. تُظهر التجارب أن التجميع متعدد الطبقات لعدد كبير من النماذج يُستخدم الوقت المُخصَّص للتدريب بشكل أفضل من محاولة العثور على النموذج الأفضل وحيدًا. المساهمة الثانية تتمثل في تقييم شامل للمنصات التجارية والعلمية للـ AutoML، تشمل TPOT، H2O، AutoWEKA، auto-sklearn، AutoGluon، وGoogle AutoML Tables. أظهرت الاختبارات التي أُجريت على مجموعة مكونة من 50 مهمة تصنيف وانحدار من منصتي Kaggle وOpenML AutoML Benchmark أن AutoGluon أسرع، وأكثر موثوقية، وأكثر دقةً بكثير. ووجدنا أن AutoGluon غالبًا ما يتفوّق على أفضل تجميع ممكن من جميع منافسيه، حتى بعد معرفة النتائج النهائية. وفي مسابقتين شهيرتين على Kaggle، تفوّق AutoGluon على 99% من علماء البيانات المشاركين بعد مجرد 4 ساعات من التدريب على البيانات الخام.

AutoGluon-Tabular: أوتوماتيكية موثوقة ودقيقة لـ AutoML للبيانات الهيكلية | أحدث الأوراق البحثية | HyperAI