日期

7 个月前

组织

论文 URL

2510.26418

标签

人工智能

思维链劫持（Chain-of-Thought Hijacking,CoT Hijacking）是由独立研究者 Jianli Zhao 和斯坦福大学等高校机构的研究团队于 2025 年 10 月提出的，相关研究成果发表于论文 Chain-of-Thought Hijacking 。

思维链劫持是一种针对推理模型的越狱攻击，即在有害指令前添加无害的推理过程。这种攻击始终能降低拒绝率，并达到当前最佳的成功率。在 HarmBench 上，思维链劫持对 Gemini 2.5 Pro 、 GPT o4 mini 、 Grok 3 mini 和 Claude 4 Sonnet 的攻击成功率（ASR）分别达到 99% 、 94% 、 100% 和 94%——远超以往针对 LRMs 的越狱方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

思维链劫持 Chain-of-Thought Hijacking

用 AI 构建 AI

HyperAI Newsletters

Command Palette

思维链劫持 Chain-of-Thought Hijacking

相关百科

思维引导的强化学习框架 Guided Thought Reinforcement

安全比对方法 Deep Aligned Visual Safety Prompt

Decomposed Forward Pass（DePass）

稀疏化接码树 Decoding Tree Sketching

SoCE 类专家 Soup

指纹识别方法 iSeal

WorldGen

稠密检索器 Dense Retriever

部署中学习 Learning While Deploying

用 AI 构建 AI

HyperAI Newsletters

Command Palette

思维链劫持 Chain-of-Thought Hijacking

相关百科

思维引导的强化学习框架 Guided Thought Reinforcement

安全比对方法 Deep Aligned Visual Safety Prompt

Decomposed Forward Pass（DePass）

稀疏化接码树 Decoding Tree Sketching

SoCE 类专家 Soup

指纹识别方法 iSeal

WorldGen

稠密检索器 Dense Retriever

部署中学习 Learning While Deploying

用 AI 构建 AI

HyperAI Newsletters

相关百科

思维引导的强化学习框架 Guided Thought Reinforcement

安全比对方法 Deep Aligned Visual Safety Prompt

Decomposed Forward Pass（DePass）

稀疏化接码树 Decoding Tree Sketching

SoCE 类专家 Soup

指纹识别方法 iSeal

WorldGen

稠密检索器 Dense Retriever

部署中学习 Learning While Deploying

相关百科

思维引导的强化学习框架 Guided Thought Reinforcement

安全比对方法 Deep Aligned Visual Safety Prompt

Decomposed Forward Pass（DePass）

稀疏化接码树 Decoding Tree Sketching

SoCE 类专家 Soup

指纹识别方法 iSeal

WorldGen

稠密检索器 Dense Retriever

部署中学习 Learning While Deploying