CoSER-Rollenspiel-Datensatz
Datum
Größe
Veröffentlichungs-URL
Lizenz
MIT
Kategorien
CoSER (CoOrdinierung einer LLM-basierten Persona SSimulation von Eetabliert Roles)-Datensatz ist ein großer realer Datensatz mit Schwerpunkt auf Rollenspielen, der 2025 gemeinsam von der Fudan-Universität und Jieyuexingchen erstellt wurde. Die relevanten Papierergebnisse sind „CoSER: Koordinierung der LLM-basierten Persona-Simulation etablierter Rollen". Es extrahiert Daten aus 771 der berühmtesten Bücher der Welt und umfasst 17.966 Charaktere und 29.798 echte Dialoge. Anders als frühere Datensätze enthält der CoSER-Datensatz nicht nur Charakterübersichten und Dialoge, sondern bietet auch umfangreiche Inhalte wie Handlungszusammenfassungen, Charaktererlebnisse und Dialoghintergründe. Darüber hinaus deckt der Dialoginhalt drei Dimensionen ab: Sprache, Handlung und Denken, wodurch die Charakterdarstellung dreidimensionaler wird. Die Einzigartigkeit des CoSER-Datensatzes liegt in seiner Authentizität und Vollständigkeit. Er extrahiert echte Charakterdialoge aus klassischen literarischen Werken, behält die Komplexität der Dialoge bei und stellt natürliche, mehrrunde, mehrrollenbasierte Dialogdaten von hoher Qualität dar.
