Command Palette
Search for a command to run...
Ensemble De Données d'évaluation De La Mémoire À Long Terme RHELM
Date
URL du document
Licence
CC BY 4.0
RHELM est un ensemble de données d'évaluation de la mémoire à longue portée publié par Microsoft en 2026. Parmi les articles de recherche associés, on peut citer… Au-delà des dialogues statiques : Évaluation comparative de la mémoire à long terme réaliste, hétérogène et évolutiveL'objectif est d'améliorer la mémoire à long terme, le raisonnement multi-sauts et les capacités de synthèse d'informations temporelles des grands modèles dans des scénarios complexes et dynamiques. Cette approche est largement utilisée dans des domaines de recherche tels que l'évaluation de la mémoire temporelle à long terme des grands modèles de langage, la vérification des capacités d'interaction à long terme des assistants IA, le raisonnement multi-sauts des grands modèles, la fusion d'informations temporelles et la détection des hallucinations. L'ensemble de données comprend 10 profils de personnages virtuels, 1 305 paires question-réponse, 629 conversations au format JSON, 625 fils de discussion par courriel au format TXT et 1 053 pièces jointes aux formats MD et HTML. Les questions associées couvrent sept types principaux : référencement de pièces jointes, raisonnement mixte, recherche de faits, détection d'illusions, agrégation d'informations, analyse de séries temporelles et questions trompeuses.
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.