HyperAIHyperAI

Command Palette

Search for a command to run...

RHELM-Datensatz Zur Langzeitgedächtnisbewertung

Datum

vor 13 Tagen

Organisation

Microsoft

Paper-URL

2605.31086

Lizenz

CC BY 4.0

RHELM ist ein von Microsoft im Jahr 2026 veröffentlichter Datensatz zur Langzeit-Speicherbewertung. Zugehörige Forschungsarbeiten umfassen... Jenseits statischer Dialoge: Benchmarking realistischer, heterogener und sich entwickelnder LangzeitgedächtnisprozesseZiel ist die Verbesserung des Langzeitgedächtnisses, des mehrstufigen Schließens und der Synthese zeitlicher Informationen großer Modelle in komplexen und dynamischen Szenarien. Es findet breite Anwendung in Forschungsbereichen wie der Bewertung des Langzeitgedächtnisses großer Sprachmodelle, der Überprüfung der Langzeitinteraktionsfähigkeiten von KI-Assistenten, dem mehrstufigen Schließen großer Modelle, der Fusion zeitlicher Informationen und der Halluzinationserkennung. Der Datensatz umfasst 10 Sätze virtueller Charakterprofile, 1.305 Frage-Antwort-Paare, 629 Konversationen im JSON-Format, 625 E-Mail-Verläufe im TXT-Format und 1.053 Anhänge im MD- und HTML-Format. Die zugehörigen Fragen decken sieben Kerntypen ab: Bezugnahme auf Anhänge, gemischtes Denken, Faktenfindung, Erkennung von Illusionen, Informationsaggregation, Zeitreihenanalyse und irreführende Fragen.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp