3달 전

MACM: 복잡한 수학 문제 해결을 위한 조건 탐색을 위한 다중 에이전트 시스템 활용

Bin Lei, Yi Zhang, Shan Zuo, Ali Payani, Caiwen Ding
MACM: 복잡한 수학 문제 해결을 위한 조건 탐색을 위한 다중 에이전트 시스템 활용
초록

최근 GPT-4와 같은 대규모 언어 모델의 발전은 표준적인 질의 처리에 있어 놀라운 능력을 보여주고 있다. 그러나 이러한 발전에도 불구하고, 복잡한 다단계 논리적 추론이 요구되는 고급 수학 문제에서는 성능이 상당히 저하된다. 추론 능력을 향상시키기 위해 현재 연구는 프롬프트 엔지니어링(prompting engineering)에 집중하고 있으며, 예를 들어 'Thought의 나무(Tree of Thought) 및 'Thought의 그래프(Graph of Thought)와 같은 접근 방식이 대표적이다. 그러나 기존의 이러한 방법들은 두 가지 주요한 한계를 안고 있다. 첫째, 복잡한 수학 문제 해결에 있어서 그 효과가 제한적이라는 점이며, 둘째, 각각의 문제에 맞춰 별도의 프롬프트를 설계해야 한다는 점이 일반화 능력을 저해한다. 이러한 한계를 극복하기 위해 본 논문은 조건부 탐색을 위한 다에이전트 시스템(Multi-Agent System for conditional Mining, MACM) 프롬프트 방법을 제안한다. 이 방법은 복잡한 수학 문제를 해결하는 데 그치지 않고, 다양한 수학적 맥락에서 뛰어난 일반화 능력을 보여준다. MACM의 도움을 받음으로써, GPT-4 Turbo의 MATH 데이터셋에서 가장 도전적인 수준 5 수학 문제에 대한 정확도는 54.68%에서 76.73%로 상승한다. 코드는 다음과 같은 URL에서 공개되어 있다: \url{https://github.com/bin123apple/MACM}.