Command Palette
Search for a command to run...
RHELM-Datensatz Zur Langzeitgedächtnisbewertung
Datum
Paper-URL
Lizenz
CC BY 4.0
RHELM ist ein von Microsoft im Jahr 2026 veröffentlichter Datensatz zur Langzeit-Speicherbewertung. Zugehörige Forschungsarbeiten umfassen... Jenseits statischer Dialoge: Benchmarking realistischer, heterogener und sich entwickelnder LangzeitgedächtnisprozesseZiel ist die Verbesserung des Langzeitgedächtnisses, des mehrstufigen Schließens und der Synthese zeitlicher Informationen großer Modelle in komplexen und dynamischen Szenarien. Es findet breite Anwendung in Forschungsbereichen wie der Bewertung des Langzeitgedächtnisses großer Sprachmodelle, der Überprüfung der Langzeitinteraktionsfähigkeiten von KI-Assistenten, dem mehrstufigen Schließen großer Modelle, der Fusion zeitlicher Informationen und der Halluzinationserkennung. Der Datensatz umfasst 10 Sätze virtueller Charakterprofile, 1.305 Frage-Antwort-Paare, 629 Konversationen im JSON-Format, 625 E-Mail-Verläufe im TXT-Format und 1.053 Anhänge im MD- und HTML-Format. Die zugehörigen Fragen decken sieben Kerntypen ab: Bezugnahme auf Anhänge, gemischtes Denken, Faktenfindung, Erkennung von Illusionen, Informationsaggregation, Zeitreihenanalyse und irreführende Fragen.
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.