HyperAI

Das Konzept des Chain-of-Thought Hijacking (CoT Hijacking) wurde im Oktober 2025 von dem unabhängigen Forscher Jianli Zhao und einem Forschungsteam der Stanford University sowie weiterer Institutionen vorgeschlagen. Die zugehörigen Forschungsergebnisse wurden in einer wissenschaftlichen Arbeit veröffentlicht. Gedankenketten-Hijacking .

Mind Chain Hijacking ist ein Jailbreak-Angriff auf Reasoning Models, bei dem ein harmloser Reasoning-Prozess vor eine schädliche Anweisung eingefügt wird. Dieser Angriff reduziert die Ablehnungsrate deutlich und erzielt hervorragende Erfolgsraten. Auf HarmBench erreichte Mind Chain Hijacking auf dem Gemini 2.5 Pro, GPT o4 mini, Grok 3 mini und Claude 4 Sonnet Erfolgsraten (ASR) von 99%, 94%, 100% bzw. 94% – weit über den bisherigen Jailbreak-Methoden für LRMs.

Command Palette

Gedankenketten-Hijacking

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Gedankenketten-Hijacking

Verwandt Wiki

Geführte Gedankenverstärkung

Sicherheitsvergleichsmethode: Tief Ausgerichtete Visuelle Sicherheitshinweise

Zerlegter Vorwärtspass (DePass)

Sparse-Code-Baum-Dekodierungsbaum-Skizzierung

SoCE-Klassenexpertensuppe

iSeal-Fingerabdruckerkennungsmethode

WorldGen

Dichter Retriever

Lernen Während Der Implementierung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Gedankenketten-Hijacking

Verwandt Wiki

Geführte Gedankenverstärkung

Sicherheitsvergleichsmethode: Tief Ausgerichtete Visuelle Sicherheitshinweise

Zerlegter Vorwärtspass (DePass)

Sparse-Code-Baum-Dekodierungsbaum-Skizzierung

SoCE-Klassenexpertensuppe

iSeal-Fingerabdruckerkennungsmethode

WorldGen

Dichter Retriever

Lernen Während Der Implementierung

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Wiki

Geführte Gedankenverstärkung

Sicherheitsvergleichsmethode: Tief Ausgerichtete Visuelle Sicherheitshinweise

Zerlegter Vorwärtspass (DePass)

Sparse-Code-Baum-Dekodierungsbaum-Skizzierung

SoCE-Klassenexpertensuppe

iSeal-Fingerabdruckerkennungsmethode

WorldGen

Dichter Retriever

Lernen Während Der Implementierung

Verwandt Wiki

Geführte Gedankenverstärkung

Sicherheitsvergleichsmethode: Tief Ausgerichtete Visuelle Sicherheitshinweise

Zerlegter Vorwärtspass (DePass)

Sparse-Code-Baum-Dekodierungsbaum-Skizzierung

SoCE-Klassenexpertensuppe

iSeal-Fingerabdruckerkennungsmethode

WorldGen

Dichter Retriever

Lernen Während Der Implementierung