Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor 10 Monaten

Organisation

Paper-URL

2509.04292

Tags

Textgenerierung

IFEval-Inverse ist ein Datensatz zur Bewertung von kontroversen Anweisungen für große Sprachmodelle, der 2025 von ByteDance Seed in Zusammenarbeit mit der Universität Nanjing, der Universität Tsinghua und anderen Institutionen veröffentlicht wurde. Die zugehörigen Ergebnisse sind:Inverse IFEval: Können LLMs hartnäckige Trainingskonventionen verlernen, um echten Anweisungen zu folgen?“, mit dem Ziel zu testen, ob das Modell die Trainingsträgheit durchbrechen und eine echte Anweisungsbefolgung erreichen kann, wenn es mit umgekehrten oder abnormalen Anweisungen konfrontiert wird. Dieser Datensatz enthält 1.012 hochwertige zweisprachige Fragebeispiele in Chinesisch und Englisch und deckt acht Arten ungewöhnlicher Unterrichtsherausforderungen in 23 verschiedenen Bereichen ab, darunter Fragekorrekturen, absichtliche Textfehler, unkommentierter Code, ungewöhnliche Formatierung, absichtlich falsche Antworten, Suggestivfragen, Unterrichtsrevisionen während des Kurses und kontrafaktische Fragenbeantwortung. Jedes Beispiel wird einer Kombination aus Mensch-Maschine-Screening und Validierung unterzogen und nutzt den automatisierten Bewertungsmechanismus „LLM-as-a-Judge“. Dadurch eignet es sich zur Bewertung und Verbesserung der Anpassungsfähigkeit und Robustheit von Modellen in nicht-traditionellen Unterrichtsszenarien und bietet zudem einen wichtigen Maßstab für die Forschung zur Minderung der kognitiven Trägheit von Modellen.

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor 10 Monaten

Organisation

Paper-URL

2509.04292

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor 10 Monaten

Organisation

Paper-URL

2509.04292

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

vor 3 Monaten

RoVid-X-Roboter-Videogenerierungsdatensatz

vor 2 Monaten

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

vor 5 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

IFEval – Inverse-Datensatz Zur Auswertung Umgekehrter Anweisungen | Datensätze | HyperAI

Command Palette

IFEval – Inverse-Datensatz Zur Auswertung Umgekehrter Anweisungen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

IFEval – Inverse-Datensatz Zur Auswertung Umgekehrter Anweisungen

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

IFEval – Inverse-Datensatz Zur Auswertung Umgekehrter Anweisungen

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz