100 PoisonMpts Chinesischer Datensatz Zur Governance Großer Modelle
Datum
Größe
Veröffentlichungs-URL
Tags
Kategorien
Angesichts der rasanten Entwicklung großer Sprachmodelle (LLMs) machen sich immer mehr Menschen Sorgen über die damit verbundenen Risiken. Daher wurde der „sicheren und monochromen“ Ausrichtung rund um große Modelle große Aufmerksamkeit geschenkt.
100PoisonMpts ist der erste Open-Source-Datensatz der Branche für chinesische Daten zur Verwaltung großer Sprachmodelle. Die erste Gruppe von Annotationsingenieuren für „100 Flaschen Gift für die KI“ besteht aus mehr als einem Dutzend namhafter Experten und Wissenschaftler, darunter der Umweltsoziologieexperte Fan Yechao, der berühmte Soziologe Li Yinhe, der Psychologe Li Songwei und der Menschenrechtsexperte Liu Xiaonan.Die Kommentatoren stellten jeweils 100 knifflige Fragen, die zu voreingenommenen und diskriminierenden Antworten führten, und kommentierten die Antworten des großen Modells, wobei sie den Angriff und die Verteidigung mit KI von „Vergiftung“ bis „Entgiftung“ vervollständigten. Die erste Reihe von Felddaten dreht sich um Antidiskriminierung, Empathie und beratende Meinungsäußerung durch KI und deckt Dimensionen wie Rechtsprechung, Psychologie, Kindererziehung, Zugänglichkeit, wenig bekannte Fakten, intime Beziehungen und Umweltgerechtigkeit ab. Es enthält von Experten gestellte Fragen und von Experten selbst verfasste oder von ihnen genehmigte Antworten.
Das Forschungsteam untersuchte die Selbstausrichtung großer Modelle basierend auf dem Expertenprinzip. Informationen zu spezifischen Methoden und experimentellen Analysen finden Sie im technischen Bericht „Selbstausrichtung großer Modelle basierend auf Expertenprinzipien“.Link
ForschungsteamBasierend auf zwei Bewertungskriterien: Sicherheit und VerantwortungEs wird ein Benchmark zur Bewertung der Werte Chinas auf Modellebene im großen Maßstab vorgeschlagen.Weitere Informationen finden Sie im Dokument „CVALUES: Messung des Werts des großen chinesischen Sprachmodells von der Sicherheit bis zur Verantwortung“.Link