
검색은 쿼리에 기반하여 대규모 코퍼스에서 관련 항목을 효율적으로 찾는 방식으로, 추천 시스템, 검색 및 자연어 처리(NLP) 분야에서 핵심적인 역할을 한다. 이러한 작업에서 점곱(dot product)은 최대 내적 검색(MIPS) 알고리즘을 통해 효율적인 검색을 가능하게 하여 유사도 함수로 널리 사용되어 왔다. 그러나 최신 검색 알고리즘은 학습된 유사도 함수로의 전환을 보이고 있다. 이러한 고도화된 접근법은 다중 쿼리 임베딩, 복잡한 신경망, 비트 시퀀스 기반의 빔 서치를 통한 직접 항목 ID 복원, 하이브리드 솔루션 등 다양한 기법을 포함한다. 그러나 이러한 최신 아키텍처 환경에서 효율적인 검색을 위한 해결책은 여전히 부족한 실정이다. 본 연구는 표현력이 풍부한 학습된 유사도 함수를 활용한 효율적인 검색 기법을 탐구함으로써 이 격차를 메운다. 우리는 '로그릿의 혼합(Mixture-of-Logits, MoL)'이 유사도 함수의 보편적 근사자(universal approximator)임을 입증하고, MoL의 표현력이 실제 실험을 통해 다양한 검색 시나리오에서 우수한 성능을 달성할 수 있음을 보여준다. 또한 MoL을 사용해 근사적인 상위-k 결과를 타이트한 오차 한계 내에서 검색할 수 있는 기법을 제안한다. 광범위한 실험을 통해, 본 연구에서 제안한 상호정보량 기반의 로드 밸런싱 손실 함수를 적용한 MoL이 추천 시스템 내 시계열 검색 모델 및 질문 응답을 위한 언어 모델 미세조정 등 다양한 이질적 환경에서 새로운 최고 성능을 기록함을 입증하였다. 또한, 본 연구에서 제안한 근사 상위-k 알고리즘은 정확한 알고리즘 대비 지연 시간에서 최대 66배의 성능 향상을 달성하면서도 정확도(recall)는 0.99 이상을 유지함으로써 기존 벤치마크를 압도한다.