Ensemble De Données De Gouvernance De Grands Modèles Chinois De 100 PoisonMpts
Date
Taille
URL de publication
Tags
Catégories
Avec le développement rapide des grands modèles de langage (LLM), de plus en plus de personnes commencent à s’inquiéter de certains des risques qu’ils peuvent entraîner. C'est pourquoi la tendance « sûre et monochrome » autour des grands modèles a reçu beaucoup d'attention.
100PoisonMpts est le premier ensemble de données chinoises open source du secteur pour la gouvernance de modèles linguistiques à grande échelle. Le premier groupe d'ingénieurs d'annotation pour « 100 bouteilles de poison pour l'IA » est composé de plus d'une douzaine d'experts et d'universitaires renommés, dont l'expert en sociologie environnementale Fan Yechao, le célèbre sociologue Li Yinhe, le psychologue Li Songwei et l'expert en droit des droits de l'homme Liu Xiaonan.Les annotateurs ont chacun posé 100 questions pièges qui ont induit des réponses biaisées et discriminatoires, et ont annoté les réponses du grand modèle, complétant l'attaque et la défense avec l'IA de « l'empoisonnement » à la « détoxification ». Le premier lot de données de terrain porte sur l’anti-discrimination, l’empathie et l’expression consultative de l’IA, et couvre des dimensions telles que la jurisprudence, la psychologie, l’éducation des enfants, l’accessibilité, les faits peu connus, les relations intimes et l’équité environnementale. Il comprend des questions posées par des experts et des réponses rédigées par des experts ou approuvées par eux.
L’équipe de recherche a exploré l’auto-alignement de grands modèles basé sur le principe expert. Pour des méthodes spécifiques et des analyses expérimentales, veuillez vous référer au rapport technique « Auto-alignement de grands modèles basé sur des principes experts »Lien
Équipe de rechercheBasé sur deux critères d'évaluation : la sécurité et la responsabilitéUne référence pour évaluer les valeurs à grande échelle du modèle chinois est proposée.Pour plus d'informations, veuillez lire le document « CVALUES : Mesurer la valeur du modèle linguistique à grande échelle de la Chine, de la sécurité à la responsabilité »Lien