HyperAI超神経

Evol-キャラクターのキャラクター設定とセリフデータセット

このデータセットは GPT3.5 および GPT4 によって生成されており、データの合理的な使用を保証するために、現在公開されているデータは 3 つのファイルで構成されており、各ファイルには 200 文字の設定とダイアログが含まれています。

データ構造

  • evol-character-gpt3.5.json
  • evol-character-male-gpt3.5.json
  • evol-character-gpt4.json

詳細は以下のとおりです。

  1. evol-character-gpt3.5.json: このデータセットには 200 の異なる文字が含まれています。各ロールのデータは、指示とダイアログの 2 つの部分に分かれています。説明パートにはキャラクターの性格や経験などの特徴が記述され、ダイアログパートには 10 セットのダイアログが含まれます (ただし、一部のキャラクターは後処理により 10 セットに満たない場合があります)。
  2. evol-character-male-gpt3.5.json: こちらも 200 文字が含まれており、データ構造は evol-character-gpt3.5.json と同じです。
  3. evol-character-gpt4.json: 200 文字も含まれており、データは gpt3.5 バージョンと比較して詳細かつ洗練されています。各役割のデータは設定とiqaの2つに分かれています。設定パートではキャラクターの性格や経験などの特徴が詳細に記述され、iqaパートではキャラクターと会話するキャラクターのキャラクター設定と、キャラクター同士の複数回の会話が収録されています。各キャラクターのデータには、関連する 3 人のキャラクターとそのキャラクターとの会話が含まれます。

利点

  • キャラクター設定詳細データ: このデータ セットは、既存のオープン ソースのロールプレイング指示データにおける不十分なロール設定という一般的な問題を補います。キャラクターのアイデンティティ、言語スタイル、背景ストーリーなど、多面的に詳細な情報が提供されます。特に GPT-4 バージョンでは、このデータ セットに対話者の身元設定も追加され、データがより完全かつ豊富になっています。
  • 多彩なキャラクター: このデータ セットは、可能な限り幅広い 2 次元キャラクターの性格をカバーしており、重複が少なく、豊富さが保証されています。
  • 生き生きとした言葉と行動の説明: このデータセットには、キャラクター間の会話だけでなく、キャラクターのアクションの説明も追加されており、会話がより鮮明でリアルになり、ユーザーにより豊かなロールプレイング体験を提供します。
  • ユニバーサルロールプレイングデータ生成フレームワーク: このデータ セットは、一般的なロールプレイング データ生成フレームワークを提供し、OpenAI API のロールプレイング機能を完全に解放します。このフレームワークによって生成されたデータは、微調整と RAG に使用されます。現在、フレームワーク コードはテストと最適化が行われており、近い将来公開される予定です。

Evol-character.torrent
シーディング 1ダウンロード中 1ダウンロード完了 99総ダウンロード数 172
  • Evol-character/
    • README.md
      2.88 KB
    • README.txt
      5.77 KB
      • data/
        • E-c.zip
          11.48 MB