Command Palette
Search for a command to run...
vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ
1. チュートリアルの概要

VibeThinker-1.5Bは、Weibo AIが2025年11月にリリースした初のオープンソース大規模モデルです。VibeThinker-1.5Bの強力な機能は、単にパラメータを積み重ねるのではなく、Weiboの開発者が提案したSSPトレーニングコンセプトに基づいています。このコンセプトは、学習フェーズにおいて、モデルが精度のみに焦点を合わせるのではなく、あらゆる可能な解パスを探索することを促します。その後、強化学習を用いて効率的なポリシー最適化を行い、正しいパスを正確に特定することで、モデルのパフォーマンスを最大化します。関連論文は「小さなモデル、大きなロジック:多様性主導の最適化がVibeThinker-1.5Bで大規模モデル推論能力を引き出す”。
このチュートリアルでは、デフォルトのリソースとしてRTX 5090グラフィックカード1枚を使用していますが、RTX 4090グラフィックカード1枚でも利用可能です。このモデルは英語の回答のみに対応しているため、英語での質問をお勧めします。
このモデルは、競争的なスタイルの数学およびアルゴリズムプログラミングの問題を解決するために推奨されます。
2. エフェクト表示

3. 操作手順
1. コンテナを起動します

2. 使用手順
「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、2~3分ほどお待ちいただき、ページを更新してください。


引用情報
このプロジェクトの引用情報は次のとおりです。
@misc{xu2025tinymodelbiglogic,
title={Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B},
author={Sen Xu and Yi Zhou and Wei Wang and Jixin Min and Zhibin Yin and Yingwei Dai and Shixi Liu and Lianyu Pang and Yirong Chen and Junlin Zhang},
year={2025},
eprint={2511.06221},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2511.06221},
}