HyperAI초신경
Back to Headlines

MIT 연구팀, AI 코치로 대형 언어모델의 문제 해결 능력 높여

5일 전

AI 코치가 텍스트와 코드 선택을 도와 문제 해결 MIT 연구원들이 개발한 CodeSteer는 큰 언어 모델(LLM)이 텍스트와 코드 생성 사이를 전환하여 문제를 올바르게 해결할 수 있도록 안내하는 지능형 도우미입니다. CodeSteer 자체도 작은 LLM으로, 큰 LLM의 현재와 과거 답변을 검토하고, 이를 수정하거나 개선하는 방법을 제시합니다. 이 과정을 통해 CodeSteer는 큰 LLM이 정확한 답변을 도출할 때까지 안내합니다. 연구팀은 CodeSteer를 이용해 큰 LLM의 기호적 작업 성능이 30% 이상 향상되었음을 발견했습니다. 예를 들어, 숫자를 곱하거나 스도쿠를 푸는 등의 작업에서 CodeSteer가 도움을 주면, 큰 LLM의 정확성이 크게 향상되었습니다. 또한 CodeSteer는 덜 발달된 모델들이 더 고급 모델보다 우수한 추론 능력을 발휘할 수 있게 해주었습니다. 이 기술은 특히 텍스트 추론만으로 해결하기 어려운 복잡한 작업, 예를 들어 불확실한 환경에서 로봇 경로 생성이나 국제 공급망에서의 배송 일정 조정 등에 유용할 것으로 보입니다. "우리는 모든 것을 할 수 있는 더 나은 모델을 개발하려는 경쟁에서 보완적인 접근 방식을 취했습니다. 각 분야에서 효과적인 기술과 도구를 개발하는 데 수년을 보낸 연구자들이 있으므로, LLM들이 적절한 도구와 방법을 선택하고 다른 사람들의 전문성을 활용하여 자신의 능력을 강화할 수 있도록 하고 싶었습니다," MIT 항공우주학과의 부교수이자 MIT 정보 및 결정 시스템 연구소(LIDS)의 연구책임자인 풍추추(Fan Chuchu) 교수는 말합니다. CodeSteer는 큰 LLM에게 텍스트나 코드 중 어느 것이 문제 해결에 더 적합한지를 판단하고, 적절한 방법으로 답변하도록 안내합니다. 예를 들어, LLM에 두 숫자 중 어느 것이 더 큰지 물어보면, 텍스트를 사용해 잘못된 답을 내놓을 가능성이 높습니다. 하지만 CodeSteer가 코드를 사용하도록 안내하면, LLM은 Python 스크립트를 생성하여 두 숫자를 비교하고 올바른 답을 내놓을 수 있습니다. CodeSteer는 처음에 쿼리를 검토하고, 문제 해결에 가장 적합한 방법을 결정합니다. 그런 다음, 큰 LLM에게 해당 방법으로 답변하도록 프롬프트를 생성합니다. 큰 LLM은 이 프롬프트에 따라 쿼리에 답하고 결과를 CodeSteer에게 반환합니다. CodeSteer는 답변을 검토한 후, 정답이 아닌 경우 다른 방법을 시도하도록 계속해서 프롬프트를 제공합니다. 예를 들어, Python 코드에 탐색 알고리즘이나 제약 조건을 포함시키도록 안내할 수 있습니다. 연구팀은 "큰 LLM이 종종 게으르게 행동하여 더 짧고 비효율적인 코드를 사용하려고 하는 경우가 많다. 우리는 CodeSteer를 설계하여 이러한 현상을 피하도록 하였다"라고 설명합니다. CodeSteer는 코드의 복잡성을 평가하는 기호 체커와 함께 작동하며, 필요에 따라 LLM에게 정답을 검증하도록 코드 생성을 요청합니다. 기존의 기호 데이터셋이 부족하여 연구팀은 37개의 복잡한 기호적 작업을 포함하는 자체 데이터셋인 SymBench를 구축하였습니다. SymBench를 활용한 미세조정 접근법을 통해 CodeSteer의 성능을 최대화하였습니다. 실험 결과, CodeSteer는 9개의 기준 방법을 모두 능가하며, 평균 정확도를 53.3%에서 86.4%까지 향상시켰습니다. 새로운 쿼리나 다양한 LLM에서도 비슷한 성능을 유지합니다. 또한, CodeSteer를 이용한 일반적인 LLM은 복잡한 추론과 계획에 초점을 맞춘 최신 모델보다 더 높은 정확도를 달성하면서도 훨씬 적은 계산을 요구합니다. "우리 방법은 LLM의 자체 능력을 활용한다. 코드를 지능적으로 사용하는 능력을 추가하여 이미 강력한 모델의 성능을 더욱 향상시킬 수 있다"라고 Chen은 말합니다. 미래에는 CodeSteer의 반복 프롬프트 과정을 더 효율적으로 만드는 것과, 텍스트 추론과 코드 생성 사이를 전환할 수 있는 통합 모델을 효과적으로 미세조정하는 방법을 연구할 계획입니다. Google Cloud AI의 연구과학자인 윤진성(Jinsung Yoon)은 "저자들은 LLM의 도구 활용에 대한 중요한 도전 과제에 대한 우아한 해결책을 제시한다. 이 간단하지만 영향력 있는 방법은 직접적인 미세조정 없이 최신 LLM의 성능을 크게 향상시키는 데 기여한다"라고 평가했습니다. Google DeepMind의 선임 연구과학자인 왕치(Chi Wang)는 "작은 전문 모델로 큰 고급 모델들을 전략적으로 안내하는 데 성공한 점이 특히 중요하다. 다양한 AI '에이전트' 간의 지능적인 협업은 복잡한 실제 상황에서 더욱 강력하고 다양한 응용 프로그램을 가능하게 한다"라고 덧붙였습니다. CodeSteer는 LLM의 문제 해결 능력 향상에 획기적인 기여를 하고 있으며, 이 기술은 앞으로 AI가 복잡한 실세계 문제를 해결하는 데 있어 중요한 역할을 할 것으로 기대된다.

Related Links