클릭률 예측을 위한 깊은 관심 진화 네트워크

클릭률(CTR) 예측은 사용자의 클릭 확률을 추정하는 것을 목표로 하며, 광고 시스템에서 핵심적인 작업 중 하나가 되었습니다. CTR 예측 모델에서는 사용자 행동 데이터 뒤에 숨겨진 잠재적 사용자 관심사를 포착하는 것이 필수적입니다. 또한 외부 환경과 내부 인지의 변화를 고려할 때, 사용자 관심사는 시간이 지남에 따라 동적으로 변화합니다. 관심사 모델링을 위한 여러 CTR 예측 방법이 있지만, 대부분의 방법은 행동의 표현을 직접적으로 관심사로 간주하고, 구체적인 행동 뒤에 있는 잠재적 관심사를 특별히 모델링하지 않는다는 한계가 있습니다. 또한 관심사의 변화 추세를 고려하는 연구는 거의 없습니다. 본 논문에서는 CTR 예측을 위해 새로운 모델인 딥 인터레스트 진화 네트워크(DIEN)를 제안합니다. 특히, 이전 행동 시퀀스에서 시간적 관심사를 포착하기 위해 관심사 추출 계층을 설계하였습니다. 이 계층에서는 각 단계에서의 관심사 추출을 감독하기 위해 보조 손실(auxiliary loss)을 도입하였습니다. 사용자들의 관심사는 다양하며, 특히 전자상거래 시스템에서는 더욱 그렇습니다. 따라서 우리는 타겟 항목과 관련된 관심사 진화 과정을 포착하기 위해 관심사 진화 계층을 제안하였습니다. 이 계층에서는 순차 구조에 주목 기제(attention mechanism)가 혁신적으로 통합되어 있으며, 진화 과정에서 상대적인 관심사의 영향력이 강화됩니다. 공개 및 산업 데이터셋 모두에서 수행한 실험 결과, DIEN은 최신 기술(state-of-the-art) 솔루션들보다 유의미하게 우수한 성능을 보였습니다. 특히, DIEN은 타오바오(Taobao)의 디스플레이 광고 시스템에 배포되었으며, CTR 측면에서 20.7% 향상을 달성하였습니다.