HyperAIHyperAI

Command Palette

Search for a command to run...

MIA多段階推論および決定軌跡データセット

日付

21時間前

データセット構成

Paper URL

2604.04503

ライセンス

MIT

MIAは、長期記憶とタスク実行能力を備えたインテリジェントエージェントのトレーニングと評価のために、華東師範大学、上海イノベーション研究所、ハルビン工業大学が2026年4月に共同で公開したデータセットです。関連する研究論文には、以下のようなものがあります。 記憶インテリジェンスエージェントその目的は、インテリジェントエージェントの長期記憶の利用能力と多段階意思決定能力を向上させることである。 このデータセットには、問題解決、計画、探索、実行の全プロセスを網羅する約21,000件の推論軌跡データが含まれており、エージェント推論や強化学習の研究に適しています。

データ構造

このデータセットには、以下のコンポーネントが含まれています。

  • トレーニング:実行者と計画者の2段階強化学習(RL)トレーニングのためのデータ。
  • テスト:複数のデータセット(例:LiveVQA、HotpotQA)にわたるベンチマークを評価し、調査および推論のパフォーマンスを測定します。
  • TTRL:テスト中に継続的な学習を行うために特別に選択されたデータであり、プランナーが推論中に戦略を調整できるようにする。
  • 画像検索キャッシュ:画像間検索タスクのキャッシュをサポートします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
MIA多段階推論および決定軌跡データセット | データセット | HyperAI超神経