@misc{xu2025tinymodelbiglogic, title={Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B}, author={Sen Xu and Yi Zhou and Wei Wang and Jixin Min and Zhibin Yin and Yingwei Dai and Shixi Liu and Lianyu Pang and Yirong Chen and Junlin Zhang}, year={2025}, eprint={2511.06221}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2511.06221}, }

날짜

8달 전

태그

논문 URL

라이선스

MIT

GitHub

WeiboAI/VibeThinker1.5k

1. 튜토리얼 소개

VibeThinker-1.5B는 2025년 11월 Weibo AI에서 공개한 최초의 오픈 소스 대규모 모델입니다. VibeThinker-1.5B의 강력한 기능은 단순히 매개변수를 늘리는 데 의존하는 것이 아니라, Weibo 개발자들이 제안한 SSP(Short-Specific Path) 학습 개념에서 비롯됩니다. 이 개념은 모델이 학습 단계에서 정확도에만 집중하는 것이 아니라 가능한 모든 해결 경로를 탐색하도록 유도합니다. 이후 강화 학습을 통해 효율적인 정책 최적화를 수행하여 정확한 경로를 선택하고 모델 성능을 극대화합니다. 관련 연구 논문은 별도로 제공됩니다. 작은 모델, 큰 논리: 다양성 기반 최적화를 통해 VibeThinker-1.5B에서 대규모 모델 추론 능력 발휘 .

이 튜토리얼에서는 기본 리소스로 RTX 5090 그래픽 카드 하나를 사용하지만, RTX 4090 그래픽 카드 하나만 사용하는 것도 가능합니다. 모델은 영어 답변만 지원하므로 영어로 질문하는 것을 권장합니다.

이 모델은 경쟁적 스타일의 수학 및 알고리즘 프로그래밍 문제를 해결하는 데 권장됩니다.

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

"모델"이 표시되지 않으면 모델이 초기화 중임을 의미합니다. 모델이 용량이 크므로 2~3분 정도 기다린 후 페이지를 새로고침해 주세요.

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@misc{xu2025tinymodelbiglogic,
      title={Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B}, 
      author={Sen Xu and Yi Zhou and Wei Wang and Jixin Min and Zhibin Yin and Yingwei Dai and Shixi Liu and Lianyu Pang and Yirong Chen and Junlin Zhang},
      year={2025},
      eprint={2511.06221},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2511.06221}, 
}

이 노트북은 커뮤니티 사용자가 기여한 것으로 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

Notebook 개요

수준

입문

주제

생성형 AI LLM 엔지니어링

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Command Palette

vLLM+OpenWebUI를 사용하여 VibeThinker-1.5B 배포

1. 튜토리얼 소개

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

인용 정보

Notebook 개요

AI로 AI 구축

HyperAI Newsletters

Command Palette

vLLM+OpenWebUI를 사용하여 VibeThinker-1.5B 배포

1. 튜토리얼 소개

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

인용 정보

Notebook 개요

관련 노트북

DeepSeek-V4-Flash를 원클릭으로 설치

Qwen3.6-27B의 원클릭 배포

vLLM + Open WebUI를 사용하여 sarvam-30b 배포

Slime: 강화 학습 확장을 위해 설계된 SGLang 네이티브 아키텍처용 사후 학습 프레임워크

Qwen3-Coder-Next를 사용하여 vLLM+Open WebUI 배포

AI로 AI 구축

HyperAI Newsletters

Command Palette

vLLM+OpenWebUI를 사용하여 VibeThinker-1.5B 배포

1. 튜토리얼 소개

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

인용 정보

Notebook 개요

관련 노트북

DeepSeek-V4-Flash를 원클릭으로 설치

Qwen3.6-27B의 원클릭 배포

vLLM + Open WebUI를 사용하여 sarvam-30b 배포

Slime: 강화 학습 확장을 위해 설계된 SGLang 네이티브 아키텍처용 사후 학습 프레임워크

Qwen3-Coder-Next를 사용하여 vLLM+Open WebUI 배포

AI로 AI 구축

HyperAI Newsletters

관련 노트북

DeepSeek-V4-Flash를 원클릭으로 설치

Qwen3.6-27B의 원클릭 배포

vLLM + Open WebUI를 사용하여 sarvam-30b 배포

Slime: 강화 학습 확장을 위해 설계된 SGLang 네이티브 아키텍처용 사후 학습 프레임워크

Qwen3-Coder-Next를 사용하여 vLLM+Open WebUI 배포

관련 노트북

DeepSeek-V4-Flash를 원클릭으로 설치

Qwen3.6-27B의 원클릭 배포

vLLM + Open WebUI를 사용하여 sarvam-30b 배포

Slime: 강화 학습 확장을 위해 설계된 SGLang 네이티브 아키텍처용 사후 학습 프레임워크

Qwen3-Coder-Next를 사용하여 vLLM+Open WebUI 배포