Command Palette
Search for a command to run...
HH-RLHF-Datensatz Zu Menschlichen Präferenzen
Date
vor 4 Monaten
Size
90.35 MB
Paper URL
License
MIT
HH-RLHF ist ein 2022 von Anthropic veröffentlichter Datensatz zu menschlichen Präferenzen, der hauptsächlich aus zwei Teilen besteht.
Zusammensetzung des Datensatzes:
- Daten zur Präferenz des Menschen für vorteilhaft/unschädlich (PM-Daten):
- Die relevanten Papierergebnisse sindTraining eines hilfreichen und harmlosen Assistenten mit Verstärkungslernen durch menschliches Feedback“, dessen Ziel es ist, menschliche Präferenzen zu nutzen, um das Dialogmodell so anzupassen, dass es sowohl „nützlich“ als auch „harmlos“ ist.
- Dieser Datensatz besteht aus gepaarten Antwortvergleichsproben (jeweils mit einer gewählten/abgelehnten Antwort) und deckt Nützlichkeit (aus Basis-, Ablehnungs- und Online-Quellen) und Harmlosigkeit (Basis) ab. Das Datenformat ist einfach und unkompliziert, daher wird eine direkte SFT nicht empfohlen. Es eignet sich für Szenarien wie RLHF/DPO-Training, die Erstellung von Belohnungsmodellen sowie den Vergleich und die Bewertung der Antwortqualität.
- Red Team-Konversationsdaten (Nicht-PM-Daten):
- Die relevanten Papierergebnisse sindRed Teaming-Sprachmodelle zur Schadensminderung: Methoden, Skalierungsverhalten und gewonnene Erkenntnisse“, dessen Ziel es ist, die Arten von Angriffen und Erscheinungsformen von Schäden zu untersuchen und dazu beizutragen, die Schädlichkeit von Modellen zu verringern.
- Dieser Datensatz enthält vollständige Red-Team-Gesprächsprotokolle und Metadaten, darunter Transkript, min_harmlessness_score_transcript, Modelltyp, Bewertung, Aufgabenbeschreibung, Tags und mehr. Die Daten ähneln realen Red-Team-Prozessen und sind reichhaltig kommentiert. Sie werden nicht für Bias-Modellierung oder SFT verwendet, eignen sich aber für Szenarien wie Sicherheitsausrichtungsanalysen, Red-Team-Bewertungen, Schadensarteninduktion und Richtlinienverbesserungen.
HH-RLHF.torrent
Seeding 1Downloading 0Completed 19Total Downloads 101
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.
AI Co-coding
Ready-to-use GPUs
Best Pricing
HyperAI Newsletters
Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp