13日前

MLCopilot:大規模言語モデルの力を解き放つ、機械学習タスクの解決に向けて

Lei Zhang, Yuge Zhang, Kan Ren, Dongsheng Li, Yuqing Yang
MLCopilot:大規模言語モデルの力を解き放つ、機械学習タスクの解決に向けて
要約

機械学習(ML)分野は広範な採用を遂げており、特定のシナリオにMLを適応させる需要が著しく高まっている。しかし、その適応は依然として高コストかつ容易ではない。MLタスクの自動化(例:AutoML)を指向する主流のアプローチは、しばしば時間のかかるものであり、人間の開発者にとって理解が困難であることも多い。一方で、人間のエンジニアはタスクを理解し、解決策について論理的に推論する驚異的な能力を備えているが、その経験や知識はしばしば限定的であり、定量的手法によって効果的に活用されにくい。本論文では、機械知能と人間の知識の間のギャップを埋めるため、最先端の大規模言語モデル(LLM)を活用して新たなタスクに対応するMLソリューションを構築するための新しいフレームワークを提案する。本研究では、LLMが構造化された入力を理解し、新規なMLタスクを解決するために包括的な推論を行う能力を拡張する可能性を示す。さらに、適切な設計を施した後、LLMが(i)既存のMLタスクの経験から学習し、(ii)効果的な推論を行うことで、新たなタスクに対して有望な結果を導き出すことが明らかになった。得られたソリューションは、そのまま実用化され、高い競争力を発揮することが可能である。具体的な例とコードは、https://github.com/microsoft/CoML にて公開されている。

MLCopilot:大規模言語モデルの力を解き放つ、機械学習タスクの解決に向けて | 最新論文 | HyperAI超神経