日期

3 个月前

大小

890.53 MB

标签

DeepSeek

许可证

MIT

GitHub

deepseek-ai/DeepSeek-R1

论文 URL

2501.12948

一、教程简介

DeepSeek-R1-Distill-Llama-70B 是深度求索（DeepSeek）公司于 2025 年推出的开源大语言模型，参数规模高达 700 亿。它是基于 Llama3.3-70B-Instruct 进行训练的，采用强化学习和蒸馏技术提升推理表现，不仅继承了 Llama 系列模型的优势，还在此基础上进一步优化了推理能力，尤其在数学、代码与逻辑推理任务中表现突出。作为 DeepSeek 系列的高性能版本，它在多个基准测试中表现出色。此外，该模型是 DeepSeek AI 提供的一款推理增强型模型，支持多种应用场景，如移动设备与边缘计算、在线推理服务等，以提高响应速度和降低运营成本，其具备非常强大的推理和决策能力。在高级 AI 助手、科研分析等领域，能够提供极其专业和深入的分析结果。例如在医学科研中，70B 版本可以对大量的医学数据进行分析，为疾病研究提供有价值的参考。

本教程使用 Ollama + Open WebUI 部署 DeepSeek-R1-Distill-Qwen-70B 作为演示，算力资源采用「单卡 A6000」。

二、运行步骤

1. 启动容器后点击 API 地址即可进入 Web 界面（若显示「Bad Gateway」，这表示模型正在初始化，由于模型较大，请等待约 5 分钟后重试。）2. 进入网页后，即可与模型展开对话！

2. 进入网页后，即可与模型展开对话

常见对话设置

1. Temperature（温度）

控制输出的随机性，范围一般在 0.0-2.0 之间。
低值（如 0.1）：更确定，偏向常见词汇。
高值（如 1.5）：更随机，可能生成更有创意但不稳定的内容。

2. Top-k Sampling（Top-k 采样）

只从概率最高的 k 个词中采样，排除低概率词汇。
k 值小（如 10）：更确定，减少偶然性。
k 值大（如 50）：更多样，增加创新性。

3. Top-p Sampling（Nucleus Sampling，Top-p 采样）

选择累计概率达到 p 的词集，不固定 k 值。
低值（如 0.3）：更确定，减少偶然性。
高值（如 0.9）：更多样，提升流畅度。

4. Repetition Penalty（重复惩罚）

控制文本重复度，通常在 1.0-2.0 之间。
值高（如 1.5）：减少重复，提升可读性。
值低（如 1.0）：无惩罚，可能导致模型重复词句。

5. Max Tokens（最大生成长度）

限制模型最多生成的 token 数，避免超长输出。
典型范围：50-4096（依赖具体模型）。

引用

@misc{deepseekai2025deepseekr1incentivizingreasoningcapability,
      title={DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning}, 
      author={DeepSeek-AI},
      year={2025},
      eprint={2501.12948},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2501.12948}, 
}

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

运行此教程在 Discord 上讨论

日期

3 个月前

大小

890.53 MB

标签

DeepSeek

许可证

MIT

GitHub

deepseek-ai/DeepSeek-R1

论文 URL

2501.12948

一、教程简介

本教程使用 Ollama + Open WebUI 部署 DeepSeek-R1-Distill-Qwen-70B 作为演示，算力资源采用「单卡 A6000」。

二、运行步骤

2. 进入网页后，即可与模型展开对话

常见对话设置

1. Temperature（温度）

控制输出的随机性，范围一般在 0.0-2.0 之间。
低值（如 0.1）：更确定，偏向常见词汇。
高值（如 1.5）：更随机，可能生成更有创意但不稳定的内容。

2. Top-k Sampling（Top-k 采样）

只从概率最高的 k 个词中采样，排除低概率词汇。
k 值小（如 10）：更确定，减少偶然性。
k 值大（如 50）：更多样，增加创新性。

3. Top-p Sampling（Nucleus Sampling，Top-p 采样）

选择累计概率达到 p 的词集，不固定 k 值。
低值（如 0.3）：更确定，减少偶然性。
高值（如 0.9）：更多样，提升流畅度。

4. Repetition Penalty（重复惩罚）

控制文本重复度，通常在 1.0-2.0 之间。
值高（如 1.5）：减少重复，提升可读性。
值低（如 1.0）：无惩罚，可能导致模型重复词句。

5. Max Tokens（最大生成长度）

限制模型最多生成的 token 数，避免超长输出。
典型范围：50-4096（依赖具体模型）。

引用

@misc{deepseekai2025deepseekr1incentivizingreasoningcapability,
      title={DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning}, 
      author={DeepSeek-AI},
      year={2025},
      eprint={2501.12948},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2501.12948}, 
}

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

一键部署 MedGemma-27b-text-it 医学推理大模型

3 个月前

一键部署 Qwen-Image-Lightning

2 个月前

DeepSeek-OCR 2 视觉因果流

10 天前

一键部署 SmolLM3-3B-Model

2 个月前

一键部署 Ministral-3-14B-Instruct

2 个月前

JarvisArt-Preview 智能照片修饰代理

1 个月前

ROCKET-2：3D 游戏零样本迁移

2 个月前

PaddleOCR-VL：多模态文档解析

3 个月前

Dia2-TTS：实时语音合成服务

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

一键部署 DeepSeek-R1-70B

一、教程简介

二、运行步骤

常见对话设置

1. Temperature（温度）

2. Top-k Sampling（Top-k 采样）

3. Top-p Sampling（Nucleus Sampling，Top-p 采样）

4. Repetition Penalty（重复惩罚）

5. Max Tokens（最大生成长度）

引用

用 AI 构建 AI

HyperAI Newsletters

Command Palette

一键部署 DeepSeek-R1-70B

一、教程简介

二、运行步骤

常见对话设置

1. Temperature（温度）

2. Top-k Sampling（Top-k 采样）

3. Top-p Sampling（Nucleus Sampling，Top-p 采样）

4. Repetition Penalty（重复惩罚）

5. Max Tokens（最大生成长度）

引用

相关教程

一键部署 MedGemma-27b-text-it 医学推理大模型

一键部署 Qwen-Image-Lightning

DeepSeek-OCR 2 视觉因果流

一键部署 SmolLM3-3B-Model

一键部署 Ministral-3-14B-Instruct

JarvisArt-Preview 智能照片修饰代理

ROCKET-2：3D 游戏零样本迁移

PaddleOCR-VL：多模态文档解析

Dia2-TTS：实时语音合成服务

用 AI 构建 AI

HyperAI Newsletters

Command Palette

一键部署 DeepSeek-R1-70B

一、教程简介

二、运行步骤

常见对话设置

1. Temperature（温度）

2. Top-k Sampling（Top-k 采样）

3. Top-p Sampling（Nucleus Sampling，Top-p 采样）

4. Repetition Penalty（重复惩罚）

5. Max Tokens（最大生成长度）

引用

相关教程

一键部署 MedGemma-27b-text-it 医学推理大模型

一键部署 Qwen-Image-Lightning

DeepSeek-OCR 2 视觉因果流

一键部署 SmolLM3-3B-Model

一键部署 Ministral-3-14B-Instruct

JarvisArt-Preview 智能照片修饰代理

ROCKET-2：3D 游戏零样本迁移

PaddleOCR-VL：多模态文档解析

Dia2-TTS：实时语音合成服务

用 AI 构建 AI

HyperAI Newsletters

相关教程

一键部署 MedGemma-27b-text-it 医学推理大模型

一键部署 Qwen-Image-Lightning

DeepSeek-OCR 2 视觉因果流

一键部署 SmolLM3-3B-Model

一键部署 Ministral-3-14B-Instruct

JarvisArt-Preview 智能照片修饰代理

ROCKET-2：3D 游戏零样本迁移

PaddleOCR-VL：多模态文档解析

Dia2-TTS：实时语音合成服务

相关教程

一键部署 MedGemma-27b-text-it 医学推理大模型

一键部署 Qwen-Image-Lightning

DeepSeek-OCR 2 视觉因果流

一键部署 SmolLM3-3B-Model

一键部署 Ministral-3-14B-Instruct

JarvisArt-Preview 智能照片修饰代理

ROCKET-2：3D 游戏零样本迁移

PaddleOCR-VL：多模态文档解析

Dia2-TTS：实时语音合成服务