HyperAIHyperAI

Command Palette

Search for a command to run...

사고의 연쇄 하이재킹

날짜

5달 전

조직

인류학적
스탠포드 대학
옥스퍼드 대학교

Paper URL

2510.26418

사고 연쇄 탈취(Chain-of-Thought Hijacking, CoT Hijacking)는 2025년 10월 독립 연구자 자오젠리(Jianli Zhao)와 스탠포드 대학교 및 기타 기관의 연구팀에 의해 제안되었습니다. 관련 연구 결과는 논문으로 발표되었습니다. 사고의 연쇄 하이재킹 .

마인드 체인 하이재킹은 추론 모델을 표적으로 하는 탈옥 공격으로, 무해한 추론 과정을 유해한 명령어 앞에 추가하는 방식입니다. 이 공격은 거부율을 지속적으로 낮추고 최첨단 수준의 성공률을 달성합니다. HarmBench에서 마인드 체인 하이재킹은 Gemini 2.5 Pro, GPT o4 mini, Grok 3 mini, Claude 4 Sonnet에 대해 각각 99%, 94%, 100%, 94%의 공격 성공률(ASR)을 기록했는데, 이는 기존의 LRM을 표적으로 하는 탈옥 방법들을 훨씬 뛰어넘는 수치입니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp