13일 전
Memp: 에이전트 절차적 기억 탐구
Runnan Fang, Yuan Liang, Xiaobin Wang, Jialong Wu, Shuofei Qiao, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang

초록
대규모 언어 모델(LLM) 기반 에이전트는 다양한 작업에서 뛰어난 성능을 보이지만, 수동적으로 설계되거나 고정된 파라미터에 얽매인 취약한 절차적 기억을 가지고 있다. 본 연구에서는 에이전트에게 학습 가능하고 업데이트 가능한, 평생 동안 유지되는 절차적 기억을 부여하기 위한 전략을 탐구한다. 우리는 Memp를 제안하며, 이는 과거 에이전트의 행동 경로를 세부적인 단계별 지시어와 고수준의 스크립트 형태의 추상화로 요약한다. 또한 절차적 기억의 구성(Build), 검색(Retrieval), 업데이트(Update)에 대한 다양한 전략이 미치는 영향을 탐색한다. 이러한 기억 저장소는 지속적으로 내용을 업데이트하고, 수정하며, 폐기하는 동적 관리 체계와 결합되어 새로운 경험과 함께 진화한다. TravelPlanner 및 ALFWorld에서의 실증 평가 결과, 기억 저장소가 점진적으로 개선됨에 따라 에이전트는 유사한 작업에서 지속적으로 높은 성공률과 더 높은 효율성을 달성함을 확인할 수 있었다. 또한, 강력한 모델에서 생성된 절차적 기억은 그 가치를 유지한다. 즉, 강력한 모델에서 학습한 절차적 기억을 약한 모델로 이식하면 상당한 성능 향상이 가능하다.