日付

3ヶ月前

サイズ

548.95 MB

タグ

LLM

ライセンス

Apache 2.0

GitHub

huggingface/smollm

論文URL

huggingface.co

1. チュートリアルの概要

SmolLM3-3Bは、Hugging Face TB（Transformer Big）チームによって2025年7月にオープンソース化され、「エッジパフォーマンスの限界」と位置付けられました。関連する研究論文には以下が含まれます。 SmolLM3: smol、多言語、長文推論エンジンこれは、コンパクトな 3B サイズの小さなモデルのパフォーマンスの限界を打ち破るように設計された、30 億のパラメータを備えた革新的なオープンソース言語モデルです。

このチュートリアルでは、RTX 5090（32 GB）グラフィックカード1枚とPyTorch 2.8 + CUDA 12.8のインストール環境を使用します。Gradioアプリケーションの読み込み時間は2～3分と推定されます。

2. プロジェクト例

下の画像は、このチュートリアルにおけるGradoインターフェースの効果を示しています。プロンプトワードを入力すると、モデルは4ビットの量子化された応答を正常に生成しました。

3. 操作手順

このセクションには、ワンクリック起動の手順、コードディレクトリ構造、およびよくある質問が記載されています。

このチュートリアルでは、Gradioアプリをワンクリックでデプロイする方法を説明します。ユーザーはコードを実行する必要はなく、以下の手順に従うだけです。

1. クローン作成チュートリアル: このページの右上隅にある「複製」をクリックして、個人用コンテナを作成します。

2. コンテナを起動して待機します。 システムは自動的にコンテナを起動します (推奨)。 RTX 5090）。 dependencies.sh スクリプトはバックグラウンドで自動的に実行され、4 ビットの量子化モデルが読み込まれます。このプロセスには約2〜3分かかります。

3. アプリケーションにアクセスします: コンテナのステータスが「実行中」に変わったら、コンテナの詳細ページで「API アドレス」をクリックして Grado インターフェースを開きます。

コードディレクトリ構造


/openbayes/home
|-- app.py                \# Gradio 应用的启动脚本
|-- requirements.txt      \# 锁定的 Python 依赖包 (已预装)
|-- dependencies.sh       \# 平台自动化执行脚本 (仅启动 app)
|-- README\_cn.md          \# 本教程说明文档 (中文)
\`-- README\_en.md          \# 本教程说明文档 (英文)

/openbayes/input/input0   # 只读绑定的 SmolLM3-3B 模型文件

よくある質問

Q: 「API アドレス」をクリックした後、ページが読み込まれない、または「502」が表示されますか? A: モデルが読み込まれているためです。 SmolLM3-3B 大規模なモデルのため、4ビット量子化バージョンでもGPUに完全に読み込むまでに2～3分かかります。ページを更新する前に数分お待ちください。
Q: ログには OSError: Cannot find empty port 8080? A: これは、ユーザー（またはシステム）がアプリケーションを複数回起動しようとしたために、ポート8080が「ゾンビプロセス」によって占有されているために発生します。コンテナターミナルでアプリケーションを実行するだけで済みます。 pkill -f "python /openbayes/home/app.py" 古いプロセスをクリーンアップして再実行します。 bash /openbayes/home/dependencies.sh それだけです。

引用情報

@misc{bakouch2025smollm3,
      title={{SmolLM3: smol, multilingual, long-context reasoner}},
      author={Bakouch, Elie and Ben Allal, Loubna and Lozhkov, Anton and Tazi, Nouamane and Tunstall, Lewis and Patiño, Carlos Miguel and Beeching, Edward and Roucher, Aymeric and Reedi, Aksel Joonas and Gallouédec, Quentin and Rasul, Kashif and Habib, Nathan and Fourrier, Clémentine and Kydlicek, Hynek and Penedo, Guilherme and Larcher, Hugo and Morlon, Mathieu and Srivastav, Vaibhav and Lochner, Joshua and Nguyen, Xuan-Son and Raffel, Colin and von Werra, Leandro and Wolf, Thomas},
      year={2025},
      howpublished={\url{[https://huggingface.co/blog/smollm3](https://huggingface.co/blog/smollm3)}}
}

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行 Discordで議論

日付

3ヶ月前

サイズ

548.95 MB

タグ

LLM

ライセンス

Apache 2.0

GitHub

huggingface/smollm

論文URL

huggingface.co

1. チュートリアルの概要

このチュートリアルでは、RTX 5090（32 GB）グラフィックカード1枚とPyTorch 2.8 + CUDA 12.8のインストール環境を使用します。Gradioアプリケーションの読み込み時間は2～3分と推定されます。

2. プロジェクト例

3. 操作手順

このセクションには、ワンクリック起動の手順、コードディレクトリ構造、およびよくある質問が記載されています。

1. クローン作成チュートリアル: このページの右上隅にある「複製」をクリックして、個人用コンテナを作成します。

コードディレクトリ構造


/openbayes/home
|-- app.py                \# Gradio 应用的启动脚本
|-- requirements.txt      \# 锁定的 Python 依赖包 (已预装)
|-- dependencies.sh       \# 平台自动化执行脚本 (仅启动 app)
|-- README\_cn.md          \# 本教程说明文档 (中文)
\`-- README\_en.md          \# 本教程说明文档 (英文)

/openbayes/input/input0   # 只读绑定的 SmolLM3-3B 模型文件

よくある質問

Q: 「API アドレス」をクリックした後、ページが読み込まれない、または「502」が表示されますか? A: モデルが読み込まれているためです。 SmolLM3-3B 大規模なモデルのため、4ビット量子化バージョンでもGPUに完全に読み込むまでに2～3分かかります。ページを更新する前に数分お待ちください。
Q: ログには OSError: Cannot find empty port 8080? A: これは、ユーザー（またはシステム）がアプリケーションを複数回起動しようとしたために、ポート8080が「ゾンビプロセス」によって占有されているために発生します。コンテナターミナルでアプリケーションを実行するだけで済みます。 pkill -f "python /openbayes/home/app.py" 古いプロセスをクリーンアップして再実行します。 bash /openbayes/home/dependencies.sh それだけです。

引用情報

@misc{bakouch2025smollm3,
      title={{SmolLM3: smol, multilingual, long-context reasoner}},
      author={Bakouch, Elie and Ben Allal, Loubna and Lozhkov, Anton and Tazi, Nouamane and Tunstall, Lewis and Patiño, Carlos Miguel and Beeching, Edward and Roucher, Aymeric and Reedi, Aksel Joonas and Gallouédec, Quentin and Rasul, Kashif and Habib, Nathan and Fourrier, Clémentine and Kydlicek, Hynek and Penedo, Guilherme and Larcher, Hugo and Morlon, Mathieu and Srivastav, Vaibhav and Lochner, Joshua and Nguyen, Xuan-Son and Raffel, Colin and von Werra, Leandro and Wolf, Thomas},
      year={2025},
      howpublished={\url{[https://huggingface.co/blog/smollm3](https://huggingface.co/blog/smollm3)}}
}

PixelReasoner-RL: ピクセルレベルの視覚推論モデル

3ヶ月前

Triton コンパイラチュートリアル

15日前

Open-AutoGLM: モバイルデバイス向けスマートアシスタント

2ヶ月前

Supertonic: ONNXに基づく高速TTS音声合成モデル

2ヶ月前

TVM チュートリアル 0.22.0

16日前

ジェスチャー認識に基づく3Dクリスマスツリー

2ヶ月前

Ministry-3-14B-Instructのワンクリック展開

2ヶ月前

PaddleOCR-VL: マルチモーダルドキュメント解析

3ヶ月前

MedGemma-27b-text-it医療推論モデルのワンクリック展開

3ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

SmolLM3-3Bモデルのワンクリック展開

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

コードディレクトリ構造

よくある質問

引用情報

AIでAIを構築

HyperAI Newsletters

Command Palette

SmolLM3-3Bモデルのワンクリック展開

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

コードディレクトリ構造

よくある質問

引用情報

関連 ノートブック

PixelReasoner-RL: ピクセルレベルの視覚推論モデル

Triton コンパイラチュートリアル

Open-AutoGLM: モバイルデバイス向けスマートアシスタント

Supertonic: ONNXに基づく高速TTS音声合成モデル

TVM チュートリアル 0.22.0

ジェスチャー認識に基づく3Dクリスマスツリー

Ministry-3-14B-Instructのワンクリック展開

PaddleOCR-VL: マルチモーダルドキュメント解析

MedGemma-27b-text-it医療推論モデルのワンクリック展開

AIでAIを構築

HyperAI Newsletters

Command Palette

SmolLM3-3Bモデルのワンクリック展開

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

コードディレクトリ構造

よくある質問

引用情報

関連 ノートブック

PixelReasoner-RL: ピクセルレベルの視覚推論モデル

Triton コンパイラチュートリアル

Open-AutoGLM: モバイルデバイス向けスマートアシスタント

Supertonic: ONNXに基づく高速TTS音声合成モデル

TVM チュートリアル 0.22.0

ジェスチャー認識に基づく3Dクリスマスツリー

Ministry-3-14B-Instructのワンクリック展開

PaddleOCR-VL: マルチモーダルドキュメント解析

MedGemma-27b-text-it医療推論モデルのワンクリック展開

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

PixelReasoner-RL: ピクセルレベルの視覚推論モデル

Triton コンパイラチュートリアル

Open-AutoGLM: モバイルデバイス向けスマートアシスタント

Supertonic: ONNXに基づく高速TTS音声合成モデル

TVM チュートリアル 0.22.0

ジェスチャー認識に基づく3Dクリスマスツリー

Ministry-3-14B-Instructのワンクリック展開

PaddleOCR-VL: マルチモーダルドキュメント解析

MedGemma-27b-text-it医療推論モデルのワンクリック展開

関連 ノートブック

PixelReasoner-RL: ピクセルレベルの視覚推論モデル

Triton コンパイラチュートリアル

Open-AutoGLM: モバイルデバイス向けスマートアシスタント

Supertonic: ONNXに基づく高速TTS音声合成モデル

TVM チュートリアル 0.22.0

ジェスチャー認識に基づく3Dクリスマスツリー

Ministry-3-14B-Instructのワンクリック展開

PaddleOCR-VL: マルチモーダルドキュメント解析

MedGemma-27b-text-it医療推論モデルのワンクリック展開

関連ノートブック

関連ノートブック

関連ノートブック

関連ノートブック