HyperAIHyperAI

Command Palette

Search for a command to run...

스펙트럴 회귀 분석을 통한 트로이안화된 DNN 탐지

Samuele Pasini Jinhan Kim Paolo Tonella

초록

현대 딥 뉴럴 네트워크(DNN)는 새로운 데이터와 기능을 통합하기 위해 반복적으로 파인튜닝됩니다. 이러한 진화적 워크플로우는 업데이트된 데이터를 완전히 신뢰할 수 없을 때, 즉 적대자가 파인튜닝 중에 트로이 목마를 심을 수 있을 때 보안 위험을 초래합니다. 본 논문은 MIST를 제시합니다. MIST는 모델의 내부 표현이 파인튜닝 동안 어떻게 변화하는지를 분석하는 트로이 목마 탐지 접근법입니다. MIST는 트리거 조건을 재구성하려는 시도를 배제하고, 사전 활성화 스펙트럼(pre-activation spectra)을 사용하여 정상적인 모델의 진화를 특성화하며, 이 기준과 일치하지 않는 스펙트럼 편차를 보이는 업데이트를 플래그 처리합니다. 이러한 프레임워크는 트로이 목마 탐지를 모델 업데이트에 대한 회귀 문제로 취급합니다. 네 가지 데이터셋과 여덟 가지 트로이 목마 공격에 대한 실증적 평가는 스펙트럼 거리가 악성으로 조작된 업데이트와 정상적인 파인튜닝을 신뢰할 수 있게 구분함을 보여줍니다. MIST는 오염된 데이터나 트리거에 대한 지식이 전혀 필요하지 않음에도 불구하고, 단일 업데이트 이후에도 최첨단 탐지 정확도를 상회하며, 다단계 정상 진화 상황에서도 우아하고 제한적인 성능 저하를 보이며 효과성을 유지합니다. 이러한 결과는 스펙트럼 진위가 악성 모델 업데이트를 탐지하기 위해 안정적이고 가정의 부담이 적은 신호를 제공함을 나타냅니다.


AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp