HyperAIHyperAI

Command Palette

Search for a command to run...

Konsole

Gedankenketten-Hijacking

Datum

vor 4 Tagen

Organisation

Anthropisch
Stanford Universität
Universität Oxford

Paper-URL

2510.26418

Das Konzept des Chain-of-Thought Hijacking (CoT Hijacking) wurde im Oktober 2025 von dem unabhängigen Forscher Jianli Zhao und einem Forschungsteam der Stanford University sowie weiterer Institutionen vorgeschlagen. Die zugehörigen Forschungsergebnisse wurden in einer wissenschaftlichen Arbeit veröffentlicht. Gedankenketten-Hijacking .

Mind Chain Hijacking ist ein Jailbreak-Angriff auf Reasoning Models, bei dem ein harmloser Reasoning-Prozess vor eine schädliche Anweisung eingefügt wird. Dieser Angriff reduziert die Ablehnungsrate deutlich und erzielt hervorragende Erfolgsraten. Auf HarmBench erreichte Mind Chain Hijacking auf dem Gemini 2.5 Pro, GPT o4 mini, Grok 3 mini und Claude 4 Sonnet Erfolgsraten (ASR) von 99%, 94%, 100% bzw. 94% – weit über den bisherigen Jailbreak-Methoden für LRMs.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp