Command Palette

Search for a command to run...

15일 전

에이전트 기반 컨텍스트 공학: 자가 개선형 언어 모델을 위한 진화하는 컨텍스트

에이전트 기반 컨텍스트 공학: 자가 개선형 언어 모델을 위한 진화하는 컨텍스트

초록

대규모 언어모델(LLM) 애플리케이션, 예를 들어 에이전트 및 도메인 특화 추론 시스템은 점점 더 많은 부분에서 컨텍스트 적응에 의존하고 있다. 즉, 모델 가중치를 업데이트하는 대신, 지시사항, 전략, 증거 등을 통해 입력을 수정하는 방식이다. 기존의 접근 방식은 사용성 향상에 기여하지만, 일반적으로 간결성 편향(brevity bias)의 문제를 겪으며, 이는 도메인에 특화된 통찰을 간략한 요약으로 대체하게 되어 정보 손실을 초래한다. 또한 반복적인 리라이팅 과정에서 세부 정보가 점차 소실되는 '컨텍스트 붕괴(context collapse)' 현상이 발생하기도 한다. 다이내믹 챠트(Dynamic Cheatsheet)에서 제안한 적응형 메모리(adaptive memory)를 기반으로, 우리는 ACE(Agentic Context Engineering)를 제안한다. ACE는 컨텍스트를 진화하는 전략 가이드북으로 간주하며, 생성(generation), 반성(reflection), 정리(curation)의 모듈화된 과정을 통해 전략을 누적하고 정제하며 체계화하는 프레임워크이다. ACE는 구조적이고 단계적인 업데이트 방식을 통해 컨텍스트 붕괴를 방지하며, 세부 지식을 유지하면서도 긴 컨텍스트 모델과 함께 확장 가능하다. 에이전트 및 도메인 특화 벤치마크에서 ACE는 오프라인(예: 시스템 프롬프트) 및 온라인(예: 에이전트 메모리) 모두에서 컨텍스트를 최적화하며, 강력한 기준 모델들을 일관되게 능가한다. 에이전트 벤치마크에서 +10.6%, 금융 도메인에서 +8.6%의 성능 향상을 기록했으며, 적응 지연 시간과 롤아웃 비용을 크게 줄였다. 특히, ACE는 레이블링된 지도 학습 없이도 자연스러운 실행 피드백(natural execution feedback)을 활용해 효과적으로 적응할 수 있었다. AppWorld 랭킹에서 ACE는 전체 평균 점수에서 상위 랭크의 프로덕션 수준 에이전트와 동등한 성능을 보였으며, 더 어려운 테스트-챌린지 분할 데이터셋에서는 이를 초과하는 성능을 기록했다. 이는 더 작은 오픈소스 모델을 사용함에도 불구하고 가능했다. 이러한 결과는 포괄적이고 진화하는 컨텍스트가 낮은 부담으로도 확장 가능하고, 효율적이며 자기 개선이 가능한 LLM 시스템을 가능하게 한다는 점을 보여준다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
에이전트 기반 컨텍스트 공학: 자가 개선형 언어 모델을 위한 진화하는 컨텍스트 | 연구 논문 | HyperAI초신경