13일 전

MLCopilot: 대규모 언어 모델의 능력을 활용하여 기계 학습 작업 해결하기

Lei Zhang, Yuge Zhang, Kan Ren, Dongsheng Li, Yuqing Yang
MLCopilot: 대규모 언어 모델의 능력을 활용하여 기계 학습 작업 해결하기
초록

기계 학습(ML) 분야는 널리 채택되며, 특정 시나리오에 ML을 적응시키는 데 대한 수요가 크게 증가하고 있다. 그러나 이러한 적응은 여전히 비용이 많이 들고 복잡한 과정이다. ML 작업을 자동화하기 위한 주된 접근 방식(예: AutoML)은 종종 시간이 오래 걸리며, 인간 개발자에게 이해하기 어렵다는 단점이 있다. 반면, 인간 엔지니어는 작업을 이해하고 해결책에 대해 추론하는 데 놀라운 능력을 지니고 있지만, 그들의 경험과 지식은 종종 제한적이며 정량적 접근 방식으로 활용하기 어렵다. 본 논문에서는 최신 대규모 언어 모델(LLM)을 활용하여 새로운 ML 작업에 대한 해결책을 개발하는 혁신적인 프레임워크를 제안함으로써, 기계 지능과 인간 지식 사이의 격차를 해소하고자 한다. 우리는 LLM이 구조화된 입력을 이해하고 새로운 ML 작업을 해결하기 위한 체계적인 추론을 수행할 수 있음을 보여주며, 일부 특별한 설계를 거친 후 LLM이 (i) 기존 ML 작업의 경험을 관찰할 수 있으며, (ii) 효과적으로 추론하여 새로운 작업에 대해 희망적인 결과를 도출할 수 있음을 발견하였다. 이러한 방식으로 생성된 해결책은 직접 사용되어 높은 수준의 경쟁력을 달성할 수 있다. 예시 및 코드는 https://github.com/microsoft/CoML 에서 확인할 수 있다.

MLCopilot: 대규모 언어 모델의 능력을 활용하여 기계 학습 작업 해결하기 | 최신 연구 논문 | HyperAI초신경