HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données d'évaluation De La Mémoire À Long Terme RHELM

Date

il y a 13 jours

Organisation

Microsoft

URL du document

2605.31086

Licence

CC BY 4.0

RHELM est un ensemble de données d'évaluation de la mémoire à longue portée publié par Microsoft en 2026. Parmi les articles de recherche associés, on peut citer… Au-delà des dialogues statiques : Évaluation comparative de la mémoire à long terme réaliste, hétérogène et évolutiveL'objectif est d'améliorer la mémoire à long terme, le raisonnement multi-sauts et les capacités de synthèse d'informations temporelles des grands modèles dans des scénarios complexes et dynamiques. Cette approche est largement utilisée dans des domaines de recherche tels que l'évaluation de la mémoire temporelle à long terme des grands modèles de langage, la vérification des capacités d'interaction à long terme des assistants IA, le raisonnement multi-sauts des grands modèles, la fusion d'informations temporelles et la détection des hallucinations. L'ensemble de données comprend 10 profils de personnages virtuels, 1 305 paires question-réponse, 629 conversations au format JSON, 625 fils de discussion par courriel au format TXT et 1 053 pièces jointes aux formats MD et HTML. Les questions associées couvrent sept types principaux : référencement de pièces jointes, raisonnement mixte, recherche de faits, détection d'illusions, agrégation d'informations, analyse de séries temporelles et questions trompeuses.

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp