HyperAI超神経

CoSER ロールプレイングデータセット

日付

2ヶ月前

サイズ

1.53 GB

組織

復旦大学

公開URL

github.com

ライセンス

MIT

コサー(共同LLMベースのペルソナの調整 Sの模倣 E設立された Roles)データセットは、2025年に復旦大学とJieyuexingchenが共同で構築した、ロールプレイングに焦点を当てた大規模な現実世界のデータセットです。関連する論文の結果は「CoSER: 確立された役割の LLM ベースのペルソナ シミュレーションの調整「」。世界で最も有名な書籍 771 冊からデータを抽出し、17,966 人の登場人物と 29,798 の実際の会話を網羅しています。以前のデータセットとは異なり、CoSER データセットには、キャラクターの概要や会話だけでなく、プロットの概要、キャラクターの経験、会話の背景などの豊富なコンテンツも含まれています。さらに、セリフ内容は言語、行動、思考の3つの次元をカバーし、キャラクターのパフォーマンスをより立体的にします。 CoSER データセットのユニークさは、その信憑性と包括性にあります。古典文学作品から実際の登場人物の会話を抽出し、会話の複雑さを保持し、自然なマルチラウンド、マルチロールの高品質の会話データです。

有名な書籍から正確に収集された、会話や設定、あらすじ、登場人物の内面の考えなどの包括的なデータ タイプを提供する CoSER データセットの例。
CoSER.torrent
シーディング 0ダウンロード中 1ダウンロード完了 29総ダウンロード数 68
  • CoSER/
    • README.md
      1.76 KB
    • README.txt
      3.51 KB
      • data/
        • CoSER.zip
          1.53 GB