RecGPT 기술 보고서

추천 시스템은 인공지능의 가장 영향력 있는 응용 분야 중 하나로, 사용자, 상점, 플랫폼 간을 연결하는 핵심 인프라로서 중요한 역할을 한다. 그러나 현재 대부분의 산업용 시스템은 여전히 과거의 동시 발생 패턴과 로그 적합 목적에 크게 의존하며, 즉 사용자의 과거 상호작용을 최적화하는 방식으로 작동하면서 사용자의 의도를 명시적으로 모델링하지 않는다. 이러한 로그 적합 기반 접근 방식은 좁은 과거 선호도에 과도하게 적합화되며, 사용자의 변화하는 잠재적 관심사를 포착하지 못하는 경향이 있다. 그 결과 필터 버블과 긴 꼬리 현상이 강화되어 사용자 경험에 악영향을 미치고, 전체 추천 생태계의 지속 가능성까지 위협하게 된다.이러한 문제를 해결하기 위해, 우리는 추천 시스템의 전반적인 설계 철학을 재검토하고, 사용자 의도를 추천 파이프라인의 중심에 두는 차세대 프레임워크인 RecGPT를 제안한다. RecGPT는 대규모 언어 모델(Large Language Models, LLMs)을 사용자 관심 탐사, 아이템 검색, 설명 생성 등의 핵심 단계에 통합함으로써, 기존의 로그 적합 기반 추천을 의도 중심의 추천으로 전환한다. 일반 목적의 LLM을 대규모로 도메인 특화된 추천 작업에 효과적으로 정렬하기 위해 RecGPT는 사전 정렬 강화와 자기학습 진화를 통합한 다단계 학습 프레임워크를 도입하며, 인간-LLM 협업 평가 시스템에 의해 안내된다. 현재 RecGPT는 타오바오 앱에 완전히 도입되어 운영 중이며, 온라인 실험 결과 RecGPT는 모든 이해관계자에게 일관된 성능 향상을 달성함을 입증했다. 사용자는 콘텐츠의 다양성과 만족도가 증가하고, 상점과 플랫폼은 더 높은 노출과 전환율을 얻는 등 종합적인 개선 효과가 나타났다. 이러한 모든 이해관계자에 걸쳐 나타난 포괄적인 성과는 LLM 기반의 의도 중심 설계가 보다 지속 가능하고 상호 이익을 추구하는 추천 생태계를 조성할 수 있음을 입증한다.