9日前

AutoGluon-Tabular:構造化データ向けのロバストで高精度なAutoML

Nick Erickson, Jonas Mueller, Alexander Shirkov, Hang Zhang, Pedro Larroy, Mu Li, Alexander Smola
AutoGluon-Tabular:構造化データ向けのロバストで高精度なAutoML
要約

AutoGluon-Tabularを紹介します。これは、CSVファイルなどの未加工の表形式データセットに対して、Pythonコード1行で高精度な機械学習モデルを訓練できるオープンソースのAutoMLフレームワークです。既存のAutoMLフレームワークが主にモデルやハイパーパラメータの選定に注力するのに対し、AutoGluon-Tabularは複数のモデルをアンサンブルし、複数層にわたってスタックする手法により、高い性能を達成しています。実験の結果、単一の最良モデルを探索するよりも、多数のモデルを多層的に組み合わせることで、割り当てられた学習時間の有効活用が可能であることが明らかになりました。本研究の第二の貢献は、TPOT、H2O、AutoWEKA、auto-sklearn、AutoGluon、Google AutoML Tablesを含む、公共および商業用AutoMLプラットフォームの包括的な評価です。KaggleおよびOpenML AutoMLベンチマークから選ばれた50の分類および回帰タスクを対象としたテストにおいて、AutoGluonはより高速で、よりロバストかつ大幅に高い精度を示しました。また、すべての競合製品の中から「後から見れば最良」となる組み合わせよりも、AutoGluonがしばしばそれを上回ることを確認しました。Kaggleで人気のある2つのコンペティションにおいて、Rawデータに対してわずか4時間の学習で、AutoGluonは参加したデータサイエンティストの99%を上回る成績を収めました。

AutoGluon-Tabular:構造化データ向けのロバストで高精度なAutoML | 最新論文 | HyperAI超神経