Command Palette
Search for a command to run...
Mem-I 강화 학습 프레임워크
Mem-I는 2025년 9월 Anuttacon, 캘리포니아 대학교 샌디에이고, 스탠퍼드 대학교의 연구팀에 의해 제안되었습니다. 관련 연구 결과는 논문으로 발표되었습니다. Mem-α: 강화 학습을 통한 기억 구성 학습 .
Mem-I는 상호작용과 피드백을 통해 복잡한 메모리 시스템을 효과적으로 관리하도록 에이전트를 훈련시키는 강화 학습 프레임워크입니다. 기존 방법과 달리, 이 프레임워크는 에이전트가 복잡하고 다중 구성 요소로 이루어진 메모리 아키텍처를 위한 메모리 구축 전략을 학습할 수 있도록 합니다. 먼저, 연구진은 메모리 구축 과정을 순차적 의사결정 문제로 정식화했습니다. 에이전트는 정보 블록을 처리하고, 수행할 메모리 작업을 결정하며, 상호작용 기록 전반에 걸쳐 후속 질문 및 답변 정확도에 따라 여러 보상을 받습니다. 둘째, 대화, 문서 공유, 패턴 인식, 스토리텔링 등 다양한 다중 턴 상호작용 패턴을 포괄하는 특수 훈련 데이터셋을 구축하고, 정답을 맞추기 위해 전체 메모리 정보를 활용해야 하는 종합적인 평가 문제를 함께 제공합니다.