FinalMLP: CTR 예측을 위한 개선된 두 개의 스트림을 가진 MLP 모델

클릭률(Click-through Rate, CTR) 예측은 온라인 광고 및 추천 시스템에서 핵심적인 과제 중 하나이다. 다층 퍼셉트론(Multi-layer Perceptron, MLP)은 많은 딥 CTR 예측 모델의 핵심 구성 요소로 활용되지만, 기존에 널리 인지된 바와 같이 순수한 MLP 네트워크만으로는 곱셈형 특성 상호작용(multiplicative feature interactions)을 효율적으로 학습하기 어렵다는 문제가 있다. 이를 해결하기 위해, DeepFM, DCN 등과 같은 두 개의 스트림을 갖는 상호작용 모델들이 제안되었으며, 이는 MLP 네트워크와 다른 전용 네트워크를 통합함으로써 CTR 예측 성능을 향상시키는 방식이다. 기존 연구에서는 보완적인 스트림에서 특성 상호작용을 명시적으로 강화하는 데 주로 집중되어 왔다. 반면, 본 연구의 실증적 분석 결과는 단순히 두 개의 MLP를 결합하는 잘 튜닝된 두 스트림 MLP 모델만으로도 놀라울 정도로 뛰어난 성능을 달성할 수 있음을 확인하였으며, 이는 기존 연구에서 보고된 바가 없는 새로운 발견이다. 이러한 관찰을 바탕으로, 본 연구는 두 스트림 간의 상호작용을 효과적으로 융합하고, 각 스트림에 대한 특성 입력을 차별화할 수 있도록 특성 게이팅(Feature Gating) 및 상호작용 집계(Interaction Aggregation) 레이어를 제안한다. 이를 통해 기존의 두 스트림 MLP 모델을 보다 강화된 형태의 모델인 FinalMLP로 개선할 수 있다. 다양한 공개 벤치마크 데이터셋(4개)에서의 평가 및 산업 시스템 내 온라인 A/B 테스트 결과, FinalMLP는 많은 고도화된 두 스트림 CTR 모델보다 우수한 성능을 보였다. 본 연구의 소스 코드는 MindSpore/models에서 공개될 예정이다.