MaskNet: 인스턴스 유도 마스크를 통해 CTR 랭킹 모델에 특징별 곱셈 도입하기

클릭률(CTR) 추정은 다양한 실-world 응용 분야에서 가장 핵심적인 과제 중 하나가 되었으며, 순위 모델이 복잡한 고차원 특징을 효과적으로 포착하는 것은 매우 중요하다. 얕은 전방향 신경망은 FNN, DeepFM, xDeepFM과 같은 최신 DNN 모델에서 고차원 특징 상호작용을 암묵적으로 포착하기 위해 널리 사용되고 있다. 그러나 일부 연구에서는 전방향 신경망과 같은 가산형 특징 상호작용이 일반적인 특징 상호작용을 포착하는 데 비효율적임을 입증하였다. 이 문제를 해결하기 위해 본 논문에서는 입력 인스턴스에 따라 가이드되는 인스턴스 기반 마스크를 제안함으로써 DNN 순위 모델에 특별한 곱셈 연산을 도입한다. 이 마스크는 특징 임베딩 레이어와 전방향 레이어에서 요소별 곱셈을 수행한다. 또한, 본 논문에서는 마스크 블록(MaskBlock)을 제안하여 DNN 모델의 전방향 레이어를 가산형과 곱셈형 특징 상호작용의 혼합 형태로 변환한다. MaskBlock은 레이어 정규화, 인스턴스 기반 마스크, 전방향 레이어를 통합한 것으로, 다양한 구성에서 새로운 순위 모델을 설계하는 기본 빌딩 블록이다. MaskBlock으로 구성된 모델은 본 논문에서 MaskNet이라 명명하며, MaskBlock이 고성능 순위 시스템을 구성하는 효과적인 기본 단위임을 입증하기 위해 두 가지 새로운 MaskNet 모델을 제안한다. 세 개의 실제 데이터셋에서 수행한 실험 결과는 제안한 MaskNet 모델이 DeepFM 및 xDeepFM과 같은 최첨단 모델을 상당히 초월함을 보여주며, 이는 MaskBlock이 새로운 고성능 순위 시스템을 구성하는 효과적인 기본 구성 요소임을 시사한다.