Date

il y a 2 ans

Taille

982.62 KB

Organisation

URL de publication

github.com

URL du document

arxiv.org

Balises

Réponse Aux Questions Intelligente

LLM

Traitement Du Langage Naturel

IA Pour La Science

Entraînement Du Modèle

Avec le développement rapide des grands modèles de langage (LLM), de plus en plus de personnes commencent à s’inquiéter de certains des risques qu’ils peuvent entraîner. C'est pourquoi la tendance « sûre et monochrome » autour des grands modèles a reçu beaucoup d'attention. 1**00PoisonMpts est le premier ensemble de données chinoises open source du secteur pour la gouvernance de modèles linguistiques à grande échelle. Le premier groupe d'ingénieurs d'annotation pour « 100 bouteilles de poison pour l'IA » est composé de plus d'une douzaine d'experts et d'universitaires renommés, dont l'expert en sociologie environnementale Fan Yechao, le célèbre sociologue Li Yinhe, le psychologue Li Songwei et l'expert en droit des droits de l'homme Liu Xiaonan.Les annotateurs ont chacun posé 100 questions pièges qui ont induit des réponses biaisées et discriminatoires, et ont annoté les réponses du grand modèle, complétant l'attaque et la défense avec l'IA de « l'empoisonnement » à la « détoxification ». Le premier lot de données de terrain porte sur l’anti-discrimination, l’empathie et l’expression consultative de l’IA, et couvre des dimensions telles que la jurisprudence, la psychologie, l’éducation des enfants, l’accessibilité, les faits peu connus, les relations intimes et l’équité environnementale. Il comprend des questions posées par des experts et des réponses rédigées par des experts ou approuvées par eux. L’équipe de recherche a exploré l’auto-alignement de grands modèles basé sur le principe expert. Pour des méthodes spécifiques et des analyses expérimentales, veuillez vous référer au rapport technique « Auto-alignement de grands modèles basé sur des principes experts »Lien Équipe de rechercheBasé sur deux critères d'évaluation : la sécurité et la responsabilitéUne référence pour évaluer les valeurs à grande échelle du modèle chinois est proposée.**Pour plus d'informations, veuillez lire le document « CVALUES : Mesurer la valeur du modèle linguistique à grande échelle de la Chine, de la sécurité à la responsabilité »Lien

Citation

@misc{xu2023cvalues, titre={CValues : Mesurer les valeurs des grands modèles linguistiques chinois, de la sécurité à la responsabilité}, author={Guohai Xu et Jiayi Liu et Ming Yan et Haotian Xu et Jinghui Si et Zhuoran Zhou et Peng Yi et Xing Gao et Jitao Sang et Rong Zhang et Ji Zhang et Chao Peng et Fei Huang et Jingren Zhou} année={2023}, eprint={2307.09705}, préfixe d'archive={arXiv}, primaryClass={cs.CL} }

100PoisonMpts.torrent

Partage 1Téléchargement 0Terminé 251Total des téléchargements 603

100PoisonMpts/
- README.md
  2.07 KB
- README.txt
  4.13 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

il y a 16 heures

Ensemble De Données d'extraction De Preuves De Condition De Requête Verbatim Spans

dans 5 heures

Ensemble De Données d'évaluation De La Mémoire À Long Terme RHELM

il y a 19 heures

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

il y a 6 jours

Ensemble De Données De Référence FigureBench Pour La Génération d'illustrations Scientifiques

il y a 8 jours

Ensemble De Données Sur Les Sentiments Liés Aux Films

il y a 13 jours

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

il y a un mois

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

il y a 14 jours

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

il y a 2 mois

Transfermarkt Football 足球转会数据集

il y a 2 mois

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

il y a 9 jours

Ensemble De Données ToolACE Pour l'apprentissage Des Outils Complexes

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord