ChatHaruhi は、32 の中国語/英語のテレビ/アニメのキャラクターと 54,000 を超える模擬ダイアログを含むデータセットです。
大規模な言語モデルで構築されたロールプレイング型チャットボットが広く注目を集めていますが、特定の架空のキャラクターを模倣するには、より高度な技術が必要です。研究者らは、プロンプトとスクリプトから抽出された文字の記憶を改善することで言語モデルを制御するアルゴリズムを提案しました。映画、小説、脚本からコーパスを収集し、構造化抽出を行うことで、研究者らは23,000以上の会話情報を収集した。これらの対話データは、ロールプレイング言語モデルのトレーニングとテストに使用できます。同時に、研究者が提案したアルゴリズムを使用し、GPT3 および GPT4 の助けを借りて、研究者はこれらのキャラクターに対して 27,000 を超える追加シミュレーションを生成しました。
做种 1
下载中 0
已完成 112
总下载 561