Command Palette
Search for a command to run...
vLLM+OpenWebUI를 사용하여 VibeThinker-1.5B 배포
GPU 컴퓨팅 에어드롭
1. 튜토리얼 소개

VibeThinker-1.5B는 2025년 11월 Weibo AI에서 공개한 최초의 오픈 소스 대규모 모델입니다. VibeThinker-1.5B의 강력한 기능은 단순히 매개변수를 늘리는 데 의존하는 것이 아니라, Weibo 개발자들이 제안한 SSP(Short-Specific Path) 학습 개념에서 비롯됩니다. 이 개념은 모델이 학습 단계에서 정확도에만 집중하는 것이 아니라 가능한 모든 해결 경로를 탐색하도록 유도합니다. 이후 강화 학습을 통해 효율적인 정책 최적화를 수행하여 정확한 경로를 선택하고 모델 성능을 극대화합니다. 관련 연구 논문은 별도로 제공됩니다. 작은 모델, 큰 논리: 다양성 기반 최적화를 통해 VibeThinker-1.5B에서 대규모 모델 추론 능력 발휘 .
이 튜토리얼에서는 기본 리소스로 RTX 5090 그래픽 카드 하나를 사용하지만, RTX 4090 그래픽 카드 하나만 사용하는 것도 가능합니다. 모델은 영어 답변만 지원하므로 영어로 질문하는 것을 권장합니다.
이 모델은 경쟁적 스타일의 수학 및 알고리즘 프로그래밍 문제를 해결하는 데 권장됩니다.
2. 효과 표시

3. 작업 단계
1. 컨테이너를 시작하세요

2. 사용 단계
"모델"이 표시되지 않으면 모델이 초기화 중임을 의미합니다. 모델이 용량이 크므로 2~3분 정도 기다린 후 페이지를 새로고침해 주세요.


인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@misc{xu2025tinymodelbiglogic,
title={Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B},
author={Sen Xu and Yi Zhou and Wei Wang and Jixin Min and Zhibin Yin and Yingwei Dai and Shixi Liu and Lianyu Pang and Yirong Chen and Junlin Zhang},
year={2025},
eprint={2511.06221},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2511.06221},
}