一、教程简介

VibeThinker-1.5B 是微博 AI 于 2025 年 11 月发布的首个开源大模型。 VibeThinker-1.5B 能力强大不靠堆参数，而是源于微博研发人员提出的 SSP 训练理念，即在学习阶段先鼓励模型发散探索所有可能的解题路径，而非一味关注正确率；随后，通过强化学习进行高效策略优化，精准锁定正确路径，将模型性能提升至极致。相关论文成果为 Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B 。

本教程默认使用资源为单卡 RTX 5090，最低可用单卡 RTX 4090 启动使用。推荐使用英文提问，模型仅支持英文回答。

推荐使用这个模型来解决竞赛风格的数学和算法编程问题。

引用信息

本项目引用信息如下：

@misc{xu2025tinymodelbiglogic, title={Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B}, author={Sen Xu and Yi Zhou and Wei Wang and Jixin Min and Zhibin Yin and Yingwei Dai and Shixi Liu and Lianyu Pang and Yirong Chen and Junlin Zhang}, year={2025}, eprint={2511.06221}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2511.06221}, }

HyperAI

运行此教程在 Discord 上讨论

日期

3 个月前

大小

1.12 MB

标签

LLM

vLLM

文本生成

许可证

MIT

GitHub

WeiboAI/VibeThinker

论文 URL

2511.06221

一、教程简介

本教程默认使用资源为单卡 RTX 5090，最低可用单卡 RTX 4090 启动使用。推荐使用英文提问，模型仅支持英文回答。

推荐使用这个模型来解决竞赛风格的数学和算法编程问题。

二、效果展示

三、运行步骤

1. 启动容器

2. 使用步骤

若不显示「Model」，这表示模型正在初始化，由于模型较大，请等待约 2-3 分钟后刷新页面。

引用信息

本项目引用信息如下：

@misc{xu2025tinymodelbiglogic,
      title={Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B}, 
      author={Sen Xu and Yi Zhou and Wei Wang and Jixin Min and Zhibin Yin and Yingwei Dai and Shixi Liu and Lianyu Pang and Yirong Chen and Junlin Zhang},
      year={2025},
      eprint={2511.06221},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2511.06221}, 
}

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

运行此教程在 Discord 上讨论

日期

3 个月前

大小

1.12 MB

标签

LLM

vLLM

文本生成

许可证

MIT

GitHub

WeiboAI/VibeThinker

论文 URL

2511.06221

一、教程简介

本教程默认使用资源为单卡 RTX 5090，最低可用单卡 RTX 4090 启动使用。推荐使用英文提问，模型仅支持英文回答。

推荐使用这个模型来解决竞赛风格的数学和算法编程问题。

二、效果展示

三、运行步骤

1. 启动容器

2. 使用步骤

若不显示「Model」，这表示模型正在初始化，由于模型较大，请等待约 2-3 分钟后刷新页面。

引用信息

本项目引用信息如下：

@misc{xu2025tinymodelbiglogic,
      title={Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B}, 
      author={Sen Xu and Yi Zhou and Wei Wang and Jixin Min and Zhibin Yin and Yingwei Dai and Shixi Liu and Lianyu Pang and Yirong Chen and Junlin Zhang},
      year={2025},
      eprint={2511.06221},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2511.06221}, 
}

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

llama.cpp+openwebui 部署 Qwen3-VL-8B-Instruct-GGUF

5 天前

HunyuanOCR：腾讯混元端到端 OCR

2 个月前

SAM3：视觉分割模型

2 个月前

Fara-7B：高效的网页智能体模型

21 天前

SoulX-Podcast 面向多方言的播客级长文本语音生成

2 个月前

Depth-Anything-3：从任何视角恢复视觉空间

2 个月前

PixelReasoner-RL：像素级视觉推理模型

3 个月前

Z-Image-Turbo：高效 6B 参数图像生成模型

2 个月前

Supertonic：基于 ONNX 的极速 TTS 语音合成模型

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

vLLM+OpenWebUI 部署 VibeThinker-1.5B

一、教程简介

二、效果展示

三、运行步骤

1. 启动容器

2. 使用步骤

引用信息

用 AI 构建 AI

HyperAI Newsletters

Command Palette

vLLM+OpenWebUI 部署 VibeThinker-1.5B

一、教程简介

二、效果展示

三、运行步骤

1. 启动容器

2. 使用步骤

引用信息

相关教程

llama.cpp+openwebui 部署 Qwen3-VL-8B-Instruct-GGUF

HunyuanOCR：腾讯混元端到端 OCR

SAM3：视觉分割模型

Fara-7B：高效的网页智能体模型

SoulX-Podcast 面向多方言的播客级长文本语音生成

Depth-Anything-3：从任何视角恢复视觉空间

PixelReasoner-RL：像素级视觉推理模型

Z-Image-Turbo：高效 6B 参数图像生成模型

Supertonic：基于 ONNX 的极速 TTS 语音合成模型

用 AI 构建 AI

HyperAI Newsletters

Command Palette

vLLM+OpenWebUI 部署 VibeThinker-1.5B

一、教程简介

二、效果展示

三、运行步骤

1. 启动容器

2. 使用步骤

引用信息

相关教程

llama.cpp+openwebui 部署 Qwen3-VL-8B-Instruct-GGUF

HunyuanOCR：腾讯混元端到端 OCR

SAM3：视觉分割模型

Fara-7B：高效的网页智能体模型

SoulX-Podcast 面向多方言的播客级长文本语音生成

Depth-Anything-3：从任何视角恢复视觉空间

PixelReasoner-RL：像素级视觉推理模型

Z-Image-Turbo：高效 6B 参数图像生成模型

Supertonic：基于 ONNX 的极速 TTS 语音合成模型

用 AI 构建 AI

HyperAI Newsletters

相关教程

llama.cpp+openwebui 部署 Qwen3-VL-8B-Instruct-GGUF

HunyuanOCR：腾讯混元端到端 OCR

SAM3：视觉分割模型

Fara-7B：高效的网页智能体模型

SoulX-Podcast 面向多方言的播客级长文本语音生成

Depth-Anything-3：从任何视角恢复视觉空间

PixelReasoner-RL：像素级视觉推理模型

Z-Image-Turbo：高效 6B 参数图像生成模型

Supertonic：基于 ONNX 的极速 TTS 语音合成模型

相关教程

llama.cpp+openwebui 部署 Qwen3-VL-8B-Instruct-GGUF

HunyuanOCR：腾讯混元端到端 OCR

SAM3：视觉分割模型

Fara-7B：高效的网页智能体模型

SoulX-Podcast 面向多方言的播客级长文本语音生成

Depth-Anything-3：从任何视角恢复视觉空间

PixelReasoner-RL：像素级视觉推理模型

Z-Image-Turbo：高效 6B 参数图像生成模型

Supertonic：基于 ONNX 的极速 TTS 语音合成模型