Command Palette
Search for a command to run...

초록
대규모 언어 모델(Large Language Models, LLMs)의 확장 성공 사례를 산업용 검색 및 추천 시스템에 재현하려는 관심이 증가하고 있지만, 대부분의 기존 산업적 접근은 트랜스포머(Transformer) 아키텍처를 그대로 이식하는 수준에 머물러 있으며, 이는 강력한 딥러닝 추천 모델(DLRM)에 비해 별도의 획기적 성능 향상을 가져오지 못한다. 첫 번째 원리 관점에서 보면, LLM의 성과는 아키텍처 자체뿐만 아니라 두 가지 보완적인 메커니즘에 기인한다. 하나는 ‘컨텍스트 엔지니어링’으로, 원시 입력 쿼리를 맥락 정보로 풍부하게 보완하여 모델의 능력을 더 효과적으로 발현하게 하는 것이며, 다른 하나는 ‘다단계 추론’으로, 중간 추론 경로를 통해 모델 출력을 반복적으로 정교화하는 방식이다. 그러나 이러한 두 메커니즘과 그 산업용 순위 결정 시스템에서 가져올 수 있는 잠재적 성능 향상 가능성은 여전히 거의 탐색되지 않은 상태이다.본 논문에서는 산업용 계단형(카스케이드) 파이프라인의 검색 및 순위 모델에 LLM 스타일의 컨텍스트 엔지니어링과 추론을 원활하게 통합하는 통합 프레임워크 OnePiece를 제안한다. OnePiece는 순수한 트랜스포머 백본 위에 구축되며, 다음과 같은 세 가지 핵심 혁신을 도입한다. (1) 구조화된 컨텍스트 엔지니어링: 사용자 상호작용 이력에 선호도 및 시나리오 신호를 추가하여 검색 및 순위 모델 모두에 통합된 구조화된 토큰 시퀀스로 변환한다. (2) 블록 단위 잠재 추론(Block-wise latent reasoning): 표현의 다단계 정교화 능력을 부여하고, 블록 크기를 조절함으로써 추론 대역폭을 확장한다. (3) 점진적 다중 작업 학습(Progressive multi-task training): 사용자 피드백 체인을 활용하여 학습 과정에서 추론 단계를 효과적으로 감독한다. OnePiece는 쇼피(Shopee)의 주요 개인화 검색 시나리오에 도입되었으며, GMV/사용자당(GMV/UU) 기준 +2% 이상, 광고 수익 기준 +2.90%의 지속적인 온라인 성과 향상을 달성하였다.