HyperAI

Le concept de détournement de la chaîne de pensée (CoT Hijacking) a été proposé en octobre 2025 par le chercheur indépendant Jianli Zhao et une équipe de recherche de l'université de Stanford et d'autres institutions. Les résultats de ces recherches ont été publiés dans un article. Détournement de la chaîne de pensée .

Le détournement de la chaîne mentale est une attaque de jailbreak ciblant les modèles de raisonnement, où un processus de raisonnement inoffensif est inséré avant une instruction malveillante. Cette attaque réduit systématiquement le taux de rejet et atteint des taux de réussite exceptionnels. Sur HarmBench, le détournement de la chaîne mentale a obtenu des taux de réussite d'attaque (ASR) de 99%, 94%, 100% et 94% sur les Gemini 2.5 Pro, GPT o4 mini, Grok 3 mini et Claude 4 Sonnet, respectivement, surpassant largement les méthodes de jailbreak précédentes ciblant les modèles de raisonnement logique.

Command Palette

Détournement De La Chaîne De Pensée

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Détournement De La Chaîne De Pensée

Associé Wiki

Renforcement De La Pensée Guidée

Méthode De Comparaison De Sécurité : Message De Sécurité Visuel Aligné En Profondeur

Passe Avant Décomposée (DePass)

Arbre De Décodage De Code De Message Clairsemé, Esquisse d'arbre

Soupe d'experts De Classe SoCE

Méthode De Reconnaissance d'empreintes Digitales iSeal

WorldGen

Retriever Dense

Apprendre En Déployant

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Détournement De La Chaîne De Pensée

Associé Wiki

Renforcement De La Pensée Guidée

Méthode De Comparaison De Sécurité : Message De Sécurité Visuel Aligné En Profondeur

Passe Avant Décomposée (DePass)

Arbre De Décodage De Code De Message Clairsemé, Esquisse d'arbre

Soupe d'experts De Classe SoCE

Méthode De Reconnaissance d'empreintes Digitales iSeal

WorldGen

Retriever Dense

Apprendre En Déployant

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Wiki

Renforcement De La Pensée Guidée

Méthode De Comparaison De Sécurité : Message De Sécurité Visuel Aligné En Profondeur

Passe Avant Décomposée (DePass)

Arbre De Décodage De Code De Message Clairsemé, Esquisse d'arbre

Soupe d'experts De Classe SoCE

Méthode De Reconnaissance d'empreintes Digitales iSeal

WorldGen

Retriever Dense

Apprendre En Déployant

Associé Wiki

Renforcement De La Pensée Guidée

Méthode De Comparaison De Sécurité : Message De Sécurité Visuel Aligné En Profondeur

Passe Avant Décomposée (DePass)

Arbre De Décodage De Code De Message Clairsemé, Esquisse d'arbre

Soupe d'experts De Classe SoCE

Méthode De Reconnaissance d'empreintes Digitales iSeal

WorldGen

Retriever Dense

Apprendre En Déployant