HyperAI
Command Palette
Search for a command to run...
ShareGPT 90k 中国語と英語のバイリンガル ヒューマン マシンの質問と回答のデータ セット
ShareGPT- Chinese-English-90k は、実際の複雑なシナリオにおけるユーザーの質問をカバーする、中国語と英語の対訳の高品質なヒューマン マシンの質問と回答のデータ セットです。高品質の対話モデルをトレーニングするために使用できます (API インターフェイスを繰り返し呼び出してマシン シミュレーションの質問と回答を生成するデータよりも、命令の配布において堅牢です)。
このデータセットの特徴は次のとおりです。
- 同時に、全く同じ意味表現を持つ中国語と英語の対訳コーパスを提供し、バイリンガル対話モデルのトレーニングに使用できます。
- すべての質問は人為的に想像されたものではなく、API ポーリングによって作成された偽のデータ (Moss など) は実際のユーザー シナリオのコマンド分布と質問表現により一致しています。
- Sharegpt データ セットは、ネチズンによる自発的な共有によって収集されます。これは、(人間の感情による) 非常に自然なフィルターに相当し、不快な経験のある会話のほとんどを除外します。
ShareGPT-Chinese-English-90k.torrent
シーディング 1ダウンロード中 0完了 313総ダウンロード数 796
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。