HyperAI

Ensemble De Données De Gouvernance De Grands Modèles Chinois De 100 PoisonMpts

Date

il y a un an

Taille

982.62 KB

Organisation

URL de publication

github.com

Avec le développement rapide des grands modèles de langage (LLM), de plus en plus de personnes commencent à s’inquiéter de certains des risques qu’ils peuvent entraîner. C'est pourquoi la tendance « sûre et monochrome » autour des grands modèles a reçu beaucoup d'attention.

100PoisonMpts est le premier ensemble de données chinoises open source du secteur pour la gouvernance de modèles linguistiques à grande échelle. Le premier groupe d'ingénieurs d'annotation pour « 100 bouteilles de poison pour l'IA » est composé de plus d'une douzaine d'experts et d'universitaires renommés, dont l'expert en sociologie environnementale Fan Yechao, le célèbre sociologue Li Yinhe, le psychologue Li Songwei et l'expert en droit des droits de l'homme Liu Xiaonan.Les annotateurs ont chacun posé 100 questions pièges qui ont induit des réponses biaisées et discriminatoires, et ont annoté les réponses du grand modèle, complétant l'attaque et la défense avec l'IA de « l'empoisonnement » à la « détoxification ». Le premier lot de données de terrain porte sur l’anti-discrimination, l’empathie et l’expression consultative de l’IA, et couvre des dimensions telles que la jurisprudence, la psychologie, l’éducation des enfants, l’accessibilité, les faits peu connus, les relations intimes et l’équité environnementale. Il comprend des questions posées par des experts et des réponses rédigées par des experts ou approuvées par eux.

L’équipe de recherche a exploré l’auto-alignement de grands modèles basé sur le principe expert. Pour des méthodes spécifiques et des analyses expérimentales, veuillez vous référer au rapport technique « Auto-alignement de grands modèles basé sur des principes experts »Lien

Équipe de rechercheBasé sur deux critères d'évaluation : la sécurité et la responsabilitéUne référence pour évaluer les valeurs à grande échelle du modèle chinois est proposée.Pour plus d'informations, veuillez lire le document « CVALUES : Mesurer la valeur du modèle linguistique à grande échelle de la Chine, de la sécurité à la responsabilité »Lien

100PoisonMpts.torrent
Partage 2Téléchargement 1Terminés 129Téléchargements totaux 408
  • 100PoisonMpts/
    • README.md
      2.07 KB
    • README.txt
      4.13 KB
      • data/
        • 100PoisonMpts.zip
          982.62 KB