Command Palette
Search for a command to run...
MIA 다단계 추론 및 결정 궤적 데이터셋
MIA는 2026년 4월, 중국동사범대학교, 상하이혁신연구소, 하얼빈공업대학교가 공동으로 발표한 데이터셋으로, 장기 기억 및 작업 실행 능력을 갖춘 지능형 에이전트의 학습 및 평가를 위해 사용됩니다. 관련 연구 논문으로는 다음과 같은 것들이 있습니다... 메모리 인텔리전스 에이전트목표는 지능형 에이전트의 장기 기억 활용 능력과 다단계 의사 결정 능력을 향상시키는 것입니다. 이 데이터 세트는 문제 해결, 계획, 탐색 및 실행의 전체 과정을 포괄하는 약 21,000개의 추론 궤적 데이터를 포함하고 있으며, 에이전트 추론 및 강화 학습 연구에 적합합니다.
데이터 구조
이 데이터 세트에는 다음과 같은 구성 요소가 포함되어 있습니다.
- 훈련: 실행자와 계획자에 대한 2단계 강화 학습(RL) 훈련을 위한 데이터.
- 테스트: 연구 및 추론 성능을 측정하기 위해 여러 데이터 세트(예: LiveVQA, HotpotQA)에 걸쳐 벤치마크를 평가합니다.
- TTRL: 테스트 중 지속적인 학습을 위해 특별히 선택된 데이터로, 계획자가 추론 중에 전략을 조정할 수 있도록 합니다.
- 이미지 검색 캐싱: 이미지 간 검색 작업에 대한 캐싱을 지원합니다.