Command Palette

Search for a command to run...

2달 전

AWorld: 에이전트형 AI를 위한 훈련 조리법의 조율

AWorld: 에이전트형 AI를 위한 훈련 조리법의 조율

초록

실제 경험을 통한 학습 패러다임은 강력한 에이전트형 AI 시스템을 개발하는 데 있어 핵심적이지만, 특히 GAIA와 같은 복잡한 벤치마크에서 두드러지는 비효율적인 경험 생성 문제로 인해 심각하게 제약받고 있다. 이를 해결하기 위해 우리는 대규모 에이전트-환경 상호작용을 위한 오픈소스 시스템인 AWorld를 소개한다. 클러스터를 활용해 작업을 분산 처리함으로써 AWorld는 기존 단일 노드 기반 순차 실행 대비 경험 수집 속도를 14.6배 가속화한다. 이 핵심적인 성능 향상은 광범위한 강화학습을 실용적이고 확장 가능한 수준으로 가능하게 한다. 이러한 능력을 기반으로 Qwen3-32B 기반의 에이전트를 학습시켰으며, 기존 기반 모델 대비 훨씬 뛰어난 성능을 달성하여 GAIA 전체 정확도를 21.59%에서 32.23%로 상승시켰다. 특히 벤치마크의 가장 도전적인 수준에서는 16.33%의 성과를 기록하며, 선도적인 사적 모델들보다도 뛰어난 성능을 보였다. 본 연구에서 제시하는 오픈소스 시스템과 이를 통해 도출된 에이전트는 효율적인 상호작용에서부터 명확한 모델 성능 향상에 이르기까지, 종합적인 에이전트형 AI 학습 파이프라인의 실용적인 모델을 제공한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
AWorld: 에이전트형 AI를 위한 훈련 조리법의 조율 | 연구 논문 | HyperAI초신경