11일 전
DeepLight: 광고 서빙에서 CTR 예측을 가속화하기 위한 깊이 있는 경량 특성 상호작용
Wei Deng, Junwei Pan, Tian Zhou, Deguang Kong, Aaron Flores, Guang Lin

초록
클릭률(Click-through rate, CTR) 예측은 온라인 전시 광고에서 핵심적인 과제이다. 임베딩 기반 신경망은 얕은 구성 요소를 통해 명시적인 특성 상호작용을 학습하고, 심층 신경망(DNN) 구성 요소를 활용해 깊은 특성 상호작용을 학습하기 위해 제안되었다. 그러나 이러한 고도로 발전된 모델들은 예측 추론 속도를 최소 수백 배 이상 저하시킨다. 실시간 광고 제공 환경에서 서비스 지연 시간이 급격히 증가하고 메모리 사용량이 높아지는 문제를 해결하기 위해, 본 논문은 \emph{DeepLight}라는 프레임워크를 제안한다. 이 프레임워크는 CTR 예측을 세 가지 측면에서 가속화한다. 첫째, 얕은 구성 요소에서 정보성 있는 특성 상호작용을 명시적으로 탐색함으로써 모델 추론 속도를 향상시킨다. 둘째, DNN 구성 요소 내부의 계층 내 및 계층 간 레이어와 파라미터를 제거하여 불필요한 구성 요소를 제거한다. 셋째, 임베딩 레이어의 희소성을 증진시켜 가장 구분력 있는 신호를 유지한다. 위의 전략들을 통합함으로써 제안된 방법은 Criteo 데이터셋에서 46배, Avazu 데이터셋에서 27배의 추론 속도 향상을 달성하면서도 예측 정확도에 어떠한 손실도 발생시키지 않았다. 이는 복잡한 임베딩 기반 신경망을 실시간 광고 제공 환경에 성공적으로 배포할 수 있는 길을 열어준다.