4일 전
AI 연구 에이전트를 위한 기계 학습: MLE-bench에서의 탐색, 탐사, 및 일반화
Edan Toledo, Karen Hambardzumyan, Martin Josifoski, Rishi Hazra, Nicolas Baldwin, Alexis Audran-Reiss, Michael Kuchnik, Despoina Magka, et al

초록
AI 연구 에이전트는 머신 러닝 모델의 설계, 구현, 훈련을 자동화하여 과학적 진보를 가속화하는 데 큰 잠재력을 보여주고 있습니다. 본 연구에서는 MLE-벤치라는 어려운 벤치마크에서 에이전트들이 실제 머신 러닝 문제를 해결하기 위해 카글 경쟁에 참여하는 방법을 개선하는 데 초점을 맞추고 있습니다. 우리는 AI 연구 에이전트를 후보 솔루션 공간을 탐색하는 검색 정책으로 정식화하였습니다. 이들은 연산자(operator)를 사용하여 솔루션을 반복적으로 수정합니다. 다양한 연산자 집합과 검색 정책(그리디, MCTS, 진화 알고리즘)을 설계하고 체계적으로 변형함으로써, 이들의 상호작용이 고성능 달성에 결정적임을 입증하였습니다. 우리의 최상의 검색 전략과 연산자 집합 조합은 MLE-벤치 라이트에서 최첨단 결과를 달성하였으며, 카글 메달 획득 성공률을 39.6%에서 47.7%로 향상시켰습니다. 우리의 연구는 자동화된 머신 러닝 발전에 있어 검색 전략, 연산자 설계, 평가 방법론을 공동으로 고려하는 것이 중요함을 강조합니다.