Command Palette
Search for a command to run...
Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes
Date
URL du document
Licence
MIT
MIA est un ensemble de données publié conjointement en avril 2026 par l'Université normale de Chine orientale, l'Institut d'innovation de Shanghai et l'Institut de technologie de Harbin. Il sert à l'entraînement et à l'évaluation d'agents intelligents dotés d'une mémoire à long terme et de capacités d'exécution de tâches. Parmi les articles de recherche associés, on peut citer… Agent de renseignement de mémoireL'objectif est d'améliorer l'utilisation de la mémoire à long terme et les capacités de prise de décision en plusieurs étapes des agents intelligents. Cet ensemble de données contient environ 21 000 données de trajectoires d’inférence, couvrant l’ensemble du processus de résolution de problèmes, de planification, de recherche et d’exécution, et convient à la recherche sur l’inférence d’agents et l’apprentissage par renforcement.
Structure des données
Cet ensemble de données contient les éléments suivants :
- Entraînement : Données pour l'entraînement par renforcement en deux étapes (RL) de l'exécuteur et du planificateur.
- Tests : Évaluer les performances de la recherche et de l'inférence sur plusieurs ensembles de données (par exemple, LiveVQA, HotpotQA).
- TTRL : Données spécifiquement sélectionnées pour un apprentissage continu pendant les tests, permettant au planificateur d’ajuster sa stratégie pendant l’inférence.
- Mise en cache de la recherche d'images : Prend en charge la mise en cache pour les tâches de recherche d'image à image.
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.