Ensemble De Données De Questions-réponses Homme-machine Bilingues Chinois Et Anglais ShareGPT 90 000
Date
il y a un an
Taille
730.58 MB
URL de publication
ShareGPT-Chinese-English-90k est un ensemble de données de réponses aux questions homme-machine de haute qualité en chinois et en anglais parallèles, couvrant les questions des utilisateurs dans des scénarios réels et complexes. Il peut être utilisé pour former des modèles conversationnels de haute qualité (qui sont plus robustes dans la distribution des instructions que les données générées en appelant à plusieurs reprises des interfaces API pour simuler des questions et des réponses générées par machine).
Les caractéristiques de cet ensemble de données sont :
- En même temps, il fournit des corpus de comparaison parallèles chinois et anglais avec exactement la même signification, qui peuvent être utilisés pour la formation de modèles de dialogue bilingues.
- Toutes les questions ne sont pas des données artificiellement imaginées ou fausses créées par des sondages API (tels que Moss), ce qui est plus conforme à la distribution des commandes et à l'expression des questions des scénarios d'utilisateurs réels.
- L'ensemble de données Sharegpt est collecté via le partage spontané par les internautes, ce qui équivaut à un filtrage très naturel (par le sens humain), éliminant la plupart des conversations avec de mauvaises expériences.
ShareGPT-Chinese-English-90k.torrent
Partage 1Téléchargement 1Terminés 186Téléchargements totaux 525