11일 전
AdsCVLR: 스폰서드 검색에서의 상업적 시각언어 표현 모델링
{Qi Zhang, Weiwei Deng, Liangjie Zhang, Ruofei Zhang, Nan Duan, Boxin Shi, Si Li, Hao Sun, Zhaoju Li, Bochen Pang, Yuefeng Zhan, Chunhui Han, Yongjie Zhu}
초록
검색 엔진에서 소비자가 제품 및 서비스를 검색할 때, 스폰서링 검색 광고(ads)가 검색 결과 옆에 나타납니다. 검색 광고의 핵심 기반인 관련성 모델링은 큰 연구적 과제와 막대한 실용적 가치로 인해 점점 더 많은 주목을 받고 있습니다. 본 논문에서는 사용자 쿼리와 상업 광고 간의 관련성을 다중 모달 구조 정보를 활용해 모델링하는 스폰서링 검색의 다중 모달 모델링 문제를 다룹니다. 이 문제를 해결하기 위해, 이미지, 텍스트 등 보완적인 다중 모달 입력을 자연스럽게 확장할 수 있는 트랜스포머 아키텍처를 제안합니다. 이는 상업적 시각-언어 표현(AdsCVLR)을 기반으로 한 대조 학습(contrastive learning)을 적용한 구조로, 이미지-텍스트 특징을 강력하게 통합하는 역할을 합니다. 또한, 이미지, 제목, 판매자, 설명 등 구조화된 정보를 포함한 총 48만 개의 라벨링된 쿼리-광고 쌍 데이터를 포함하는 공개 광고 데이터셋을 구축했습니다. 실증적으로는 대규모 산업 데이터셋을 기반으로 AdsCVLR 모델을 평가하였으며, 온라인 및 오프라인 실험 결과를 통해 제안한 방법의 우수성을 입증하였습니다.