16일 전
음성 내 이미지 기반 딥 스테가노그래피의 강건성 향상
Jaume Ros, Margarita Geleta, Jordi Pons, Xavier Giro-i-Nieto

초록
스테가노그래피 분야는 최근 인공지능 기반 기법의 발전으로 인해 급격한 관심을 끌고 있으며, 특히 서로 다른 성질의 신호 내에 신호를 은닉할 수 있는 다중모달 환경에서의 응용이 두드러지고 있다. 모든 스테가노그래피 기법의 주요 목표는 인지적 투명성(perceptual transparency), 강건성(robustness), 그리고 대용량 임베딩(embedding capacity)을 달성하는 것으로, 이 세 가지 요소는 종종 상충되는 목표로서 전통적인 방법론이 균형을 이루기 어려웠다. 본 논문은 기존의 이미지-음성(image-in-audio) 딥 스테가노그래피 기법을 확장하고 개선하는 데 초점을 맞추며, 특히 강건성 향상을 목표로 한다. 제안된 개선 방안으로는 손실 함수의 재설계, 단기 푸리에 변환(Short-Time Fourier Transform, STFT)의 활용, 오류 수정을 위한 인코딩 과정에서의 중복성 도입, 그리고 픽셀 하위컨볼루션 연산에서 추가 정보를 버퍼링하는 기법이 포함된다. 실험 결과, 제안하는 방법이 기존 기법에 비해 강건성과 인지적 투명성 측면에서 모두 우수한 성능을 보임을 입증하였다.