HyperAIHyperAI

Command Palette

Search for a command to run...

WebSailor: 웹 에이전트를 위한 초인적 추론 탐색

초록

인간의 인지적 제한을 초월하는 것은 LLM(대형 언어 모델) 훈련에서 중요한 전선입니다. DeepResearch와 같은 소유권이 있는 에이전트 시스템들은 BrowseComp와 같은 극도로 복잡한 정보 탐색 벤치마크에서 초인적인 능력을 보여주었는데, 이는 이전에는 불가능했던 업적이었습니다. 우리는 이러한 성공이 오픈소스 모델에 없는 고도화된 추론 패턴에 기반한다고 주장합니다. 즉, 방대한 정보 공간을 탐색할 때 극단적인 불확실성을 체계적으로 줄일 수 있는 능력입니다. 이 통찰력을 바탕으로, 우리는 이 핵심 능력을 부여하기 위해 설계된 완전한 후 훈련 방법론인 WebSailor를 소개합니다. 우리의 접근 방식은 구조화된 샘플링과 정보 은폐를 통해 새로운 고불확실성 작업을 생성하고, RFT 콜드 스타트 및 효율적인 에이전트 강화학습 알고리즘인 DUPO(Duplicating Sampling Policy Optimization)를 사용하는 것입니다. 이 통합 파이프라인을 통해 WebSailor는 복잡한 정보 탐색 작업에서 모든 오픈소스 에이전트를 크게 앞서며, 소유권이 있는 에이전트들의 성능과 맞먹고 능력 차이를 좁혔습니다.


AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
WebSailor: 웹 에이전트를 위한 초인적 추론 탐색 | 문서 | HyperAI초신경