HyperAI

1. 튜토리얼 소개

VibeThinker-1.5B는 Weibo AI가 2025년 11월에 출시한 최초의 오픈소스 대규모 모델입니다. VibeThinker-1.5B의 강력한 기능은 단순히 매개변수를 추가하는 데 의존하지 않습니다. Weibo 개발자들이 제안한 SSP 학습 개념에서 비롯됩니다. 이 개념은 모델이 학습 단계에서 정확도에만 집중하는 것이 아니라 가능한 모든 해결 경로를 탐색하도록 합니다. 이후 강화 학습을 통해 효율적인 정책 최적화를 구현하여 정확한 경로를 정확하게 설정하고 모델 성능을 극대화합니다. 관련 논문의 제목은 "작은 모델, 큰 논리: 다양성 기반 최적화를 통해 VibeThinker-1.5B에서 대규모 모델 추론 능력 발휘".

이 튜토리얼에서는 기본 리소스로 RTX 5090 그래픽 카드 하나를 사용하지만, RTX 4090 그래픽 카드 하나만 사용하는 것도 가능합니다. 모델은 영어 답변만 지원하므로 영어로 질문하는 것을 권장합니다.

이 모델은 경쟁적 스타일의 수학 및 알고리즘 프로그래밍 문제를 해결하는 데 권장됩니다.

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

"모델"이 표시되지 않으면 모델이 초기화 중임을 의미합니다. 모델이 용량이 크므로 2~3분 정도 기다린 후 페이지를 새로고침해 주세요.

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@misc{xu2025tinymodelbiglogic,
      title={Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B}, 
      author={Sen Xu and Yi Zhou and Wei Wang and Jixin Min and Zhibin Yin and Yingwei Dai and Shixi Liu and Lianyu Pang and Yirong Chen and Junlin Zhang},
      year={2025},
      eprint={2511.06221},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2511.06221}, 
}

vLLM+OpenWebUI를 사용하여 VibeThinker-1.5B 배포

1. 튜토리얼 소개

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

인용 정보

AI로 AI 구축

Hyper Newsletters

Command Palette

vLLM+OpenWebUI를 사용하여 VibeThinker-1.5B 배포

1. 튜토리얼 소개

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

인용 정보

AI로 AI 구축

Hyper Newsletters