17일 전

제품 매칭을 위한 감독형 대조 학습

Ralph Peeters, Christian Bizer
제품 매칭을 위한 감독형 대조 학습
초록

최근 몇 년간 대조 학습(contrastive learning)은 컴퓨터 비전 및 정보 검색 분야에서 여러 작업의 최첨단 성능을 끌어올렸다. 본 포스터는 전자상거래에서 다양한 전자상거래 플랫폼의 상품 제안을 활용하여 상품 매칭(task of product matching)에 감독형 대조 학습(supervised contrastive learning)을 적용한 최초의 연구이다. 구체적으로, 우리는 감독형 대조 학습 기법을 사용하여 Transformer 인코더를 사전 학습(pre-train)한 후, 쌍별(pair-wise) 학습 데이터를 이용해 해당 모델을 미세 조정(fine-tune)하여 매칭 작업에 적용한다. 또한, 학습 데이터에 상품 식별자가 포함되지 않은 경우에도 대조 학습을 적용할 수 있도록 소스 인지(sources-aware) 샘플링 전략을 제안한다. 실험을 통해 감독형 대조 사전 학습과 소스 인지 샘플링을 병행 적용할 경우, 여러 널리 사용되는 벤치마크에서 기존 최첨단 성능을 크게 향상시킴을 입증하였다. Abt-Buy 데이터셋에서는 F1 스코어 94.29를 달성하여 기존 최고 성능 대비 +3.24 향상되었으며, Amazon-Google 데이터셋에서는 79.28(+3.7)을 기록하였다. WDC Computers 데이터셋의 경우, 학습 데이터셋 크기에 따라 F1 스코어가 +0.8에서 +8.84까지 향상되었다. 또한 데이터 증강(data augmentation)과 자기지도형 대조 사전 학습(self-supervised contrastive pre-training)에 대한 추가 실험을 수행한 결과, 소규모 학습 데이터셋에서는 데이터 증강이 유용한 것으로 나타났으나, 자기지도형 대조 사전 학습은 내재된 레이블 노이즈로 인해 성능이 크게 저하되는 것으로 확인되었다. 따라서 본 연구는 명시적 감독 정보가 존재하는 상품 매칭 활용 사례에서 대조 사전 학습이 매우 높은 잠재력을 지닌다고 결론지을 수 있다.

제품 매칭을 위한 감독형 대조 학습 | 최신 연구 논문 | HyperAI초신경