Command Palette
Search for a command to run...
MIA多段階推論および決定軌跡データセット
MIAは、長期記憶とタスク実行能力を備えたインテリジェントエージェントのトレーニングと評価のために、華東師範大学、上海イノベーション研究所、ハルビン工業大学が2026年4月に共同で公開したデータセットです。関連する研究論文には、以下のようなものがあります。 記憶インテリジェンスエージェントその目的は、インテリジェントエージェントの長期記憶の利用能力と多段階意思決定能力を向上させることである。 このデータセットには、問題解決、計画、探索、実行の全プロセスを網羅する約21,000件の推論軌跡データが含まれており、エージェント推論や強化学習の研究に適しています。
データ構造
このデータセットには、以下のコンポーネントが含まれています。
- トレーニング:実行者と計画者の2段階強化学習(RL)トレーニングのためのデータ。
- テスト:複数のデータセット(例:LiveVQA、HotpotQA)にわたるベンチマークを評価し、調査および推論のパフォーマンスを測定します。
- TTRL:テスト中に継続的な学習を行うために特別に選択されたデータであり、プランナーが推論中に戦略を調整できるようにする。
- 画像検索キャッシュ:画像間検索タスクのキャッシュをサポートします。