Command Palette
Search for a command to run...
사고의 연쇄 하이재킹
사고 연쇄 탈취(Chain-of-Thought Hijacking, CoT Hijacking)는 2025년 10월 독립 연구자 자오젠리(Jianli Zhao)와 스탠포드 대학교 및 기타 기관의 연구팀에 의해 제안되었습니다. 관련 연구 결과는 논문으로 발표되었습니다. 사고의 연쇄 하이재킹 .
마인드 체인 하이재킹은 추론 모델을 표적으로 하는 탈옥 공격으로, 무해한 추론 과정을 유해한 명령어 앞에 추가하는 방식입니다. 이 공격은 거부율을 지속적으로 낮추고 최첨단 수준의 성공률을 달성합니다. HarmBench에서 마인드 체인 하이재킹은 Gemini 2.5 Pro, GPT o4 mini, Grok 3 mini, Claude 4 Sonnet에 대해 각각 99%, 94%, 100%, 94%의 공격 성공률(ASR)을 기록했는데, 이는 기존의 LRM을 표적으로 하는 탈옥 방법들을 훨씬 뛰어넘는 수치입니다.