AFlow: 에이전트 워크플로우 생성 자동화

대규모 언어 모델(Large Language Models, LLM)은 다양한 분야에서 복잡한 작업을 해결하는 데 놀라운 잠재력을 보여왔으며, 일반적으로 세부 지침과 운영 절차를 따르는 에이전트 워크플로우(agent workflows)를 활용한다. 그러나 이러한 워크플로우를 구축하는 데는 상당한 인적 노력이 필요하여 확장성과 일반화 능력이 제한된다. 최근 연구들은 이러한 워크플로우의 자동 생성 및 최적화를 시도하고 있으나, 기존 방법들은 여전히 초기 수동 설정에 의존하며 완전한 자동화와 효과적인 워크플로우 생성을 달성하지 못하고 있다. 본 연구는 이러한 과제를 해결하기 위해 워크플로우 최적화를 코드 기반 표현된 워크플로우 위에서의 탐색 문제로 재정의한다. 여기서 LLM을 호출하는 노드들이 간선으로 연결된 구조를 형성한다. 우리는 AFlow라는 자동화된 프레임워크를 제안하며, 몬테카를로 트리 탐색(Monte Carlo Tree Search)을 활용해 이 공간을 효율적으로 탐색한다. AFlow는 코드 수정, 트리 구조의 경험 저장, 실행 피드백을 반복적으로 활용하여 워크플로우를 지속적으로 개선한다. 여섯 개의 벤치마크 데이터셋에서 수행된 실험 결과는 AFlow의 효과성을 입증하며, 최신 기준 대비 평균 5.7%의 성능 향상을 달성했다. 또한 AFlow는 더 작은 모델이 GPT-4o의 4.55%의 추론 비용(달러 기준)으로 특정 작업에서 GPT-4o를 능가할 수 있도록 한다. 코드는 https://github.com/FoundationAgents/AFlow 에 공개되어 있다.