HyperAI

CoSER-Rollenspiel-Datensatz

Datum

vor 2 Monaten

Größe

1.53 GB

Organisation

Fudan-Universität

Veröffentlichungs-URL

github.com

Lizenz

MIT

CoSER (CoOrdinierung einer LLM-basierten Persona SSimulation von Eetabliert Roles)-Datensatz ist ein großer realer Datensatz mit Schwerpunkt auf Rollenspielen, der 2025 gemeinsam von der Fudan-Universität und Jieyuexingchen erstellt wurde. Die relevanten Papierergebnisse sind „CoSER: Koordinierung der LLM-basierten Persona-Simulation etablierter Rollen". Es extrahiert Daten aus 771 der berühmtesten Bücher der Welt und umfasst 17.966 Charaktere und 29.798 echte Dialoge. Anders als frühere Datensätze enthält der CoSER-Datensatz nicht nur Charakterübersichten und Dialoge, sondern bietet auch umfangreiche Inhalte wie Handlungszusammenfassungen, Charaktererlebnisse und Dialoghintergründe. Darüber hinaus deckt der Dialoginhalt drei Dimensionen ab: Sprache, Handlung und Denken, wodurch die Charakterdarstellung dreidimensionaler wird. Die Einzigartigkeit des CoSER-Datensatzes liegt in seiner Authentizität und Vollständigkeit. Er extrahiert echte Charakterdialoge aus klassischen literarischen Werken, behält die Komplexität der Dialoge bei und stellt natürliche, mehrrunde, mehrrollenbasierte Dialogdaten von hoher Qualität dar.

Ein Beispiel aus dem CoSER-Datensatz, der umfassende Datentypen wie Dialoge und Einstellungen, Handlungszusammenfassungen und innere Gedanken der Charaktere bereitstellt, die authentisch aus bekannten Büchern stammen.
CoSER.torrent
Seeding 0Herunterladen 1Abgeschlossen 29Gesamtdownloads 68
  • CoSER/
    • README.md
      1.76 KB
    • README.txt
      3.51 KB
      • data/
        • CoSER.zip
          1.53 GB