Command Palette
Search for a command to run...
SmolLM3-3B 모델의 원클릭 배포
GPU 컴퓨팅 에어드롭
1. 튜토리얼 소개
SmolLM3-3B는 Hugging Face TB(Transformer Big) 팀에서 오픈소스로 공개되었으며, 2025년 7월에 "엣지 컴퓨팅 성능의 정점"으로 자리매김했습니다. 관련 연구 논문은 다음과 같습니다... SmolLM3: smol, 다국어, 장문 맥락 추론기 이는 30억 개의 매개변수를 가진 혁신적인 오픈 소스 언어 모델로, 30억이라는 컴팩트한 크기로 소형 모델의 성능 한계를 뛰어넘도록 설계되었습니다.
이 튜토리얼에서는 RTX 5090(32GB) 그래픽 카드 1개와 PyTorch 2.8 + CUDA 12.8 설치 환경을 사용합니다. Gradio 애플리케이션의 예상 로딩 시간은 2~3분입니다.
2. 프로젝트 예시
아래 이미지는 이 튜토리얼에서 Grado 인터페이스의 효과를 보여줍니다. 프롬프트 단어를 입력하자 모델이 4비트 양자화된 응답을 성공적으로 제공했습니다.

3. 작업 단계
이 섹션에는 원클릭 시작에 대한 지침, 코드 디렉토리 구조 및 자주 묻는 질문에 대한 내용이 포함되어 있습니다.
이 튜토리얼에서는 클릭 한 번으로 Gradio 앱을 배포하는 방법을 보여줍니다. 사용자는 코드를 실행할 필요 없이 다음 단계를 따르기만 하면 됩니다.
1. 클로닝 튜토리얼: 이 페이지의 오른쪽 상단에 있는 "복제"를 클릭하여 개인 컨테이너를 만드세요.

2. 컨테이너를 시작하고 기다리세요. 시스템이 자동으로 컨테이너를 시작합니다(권장). RTX 5090). dependencies.sh 스크립트는 백그라운드에서 자동으로 실행되어 4비트 양자화 모델을 로드합니다.이 과정은 약 2~3분 정도 걸립니다.
3. 애플리케이션에 접속하세요: 컨테이너 상태가 "실행 중"으로 변경되면 컨테이너 세부 정보 페이지에서 "API 주소"를 클릭하여 Grado 인터페이스를 엽니다.

코드 디렉토리 구조
/openbayes/home |-- app.py \# Gradio 应用的启动脚本 |-- requirements.txt \# 锁定的 Python 依赖包 (已预装) |-- dependencies.sh \# 平台自动化执行脚本 (仅启动 app) |-- README\_cn.md \# 本教程说明文档 (中文) \`-- README\_en.md \# 本教程说明文档 (英文) /openbayes/input/input0 # 只读绑定的 SmolLM3-3B 模型文件
자주 묻는 질문
- 질문: "API 주소"를 클릭한 후 페이지가 로드되지 않거나 "502"가 표시되나요? A: 모델이 로딩 중이기 때문입니다.
SmolLM3-3B모델이 커서 4비트 양자화 버전이라도 GPU에 완전히 로드하는 데 2~3분이 걸립니다. 페이지를 새로 고치기 전에 몇 분 정도 기다려 주세요. - Q: 로그에 다음과 같은 내용이 표시됩니다.
OSError: Cannot find empty port 8080? A: 이는 사용자(또는 사용자 시스템)가 애플리케이션을 여러 번 시작하려고 시도하여 8080 포트가 "좀비 프로세스"에 의해 점유되었기 때문입니다. 컨테이너 터미널에서만 실행하면 됩니다.pkill -f "python /openbayes/home/app.py"오래된 프로세스를 정리한 다음 다시 실행합니다.bash /openbayes/home/dependencies.sh그게 전부입니다.
인용 정보
@misc{bakouch2025smollm3,
title={{SmolLM3: smol, multilingual, long-context reasoner}},
author={Bakouch, Elie and Ben Allal, Loubna and Lozhkov, Anton and Tazi, Nouamane and Tunstall, Lewis and Patiño, Carlos Miguel and Beeching, Edward and Roucher, Aymeric and Reedi, Aksel Joonas and Gallouédec, Quentin and Rasul, Kashif and Habib, Nathan and Fourrier, Clémentine and Kydlicek, Hynek and Penedo, Guilherme and Larcher, Hugo and Morlon, Mathieu and Srivastav, Vaibhav and Lochner, Joshua and Nguyen, Xuan-Son and Raffel, Colin and von Werra, Leandro and Wolf, Thomas},
year={2025},
howpublished={\url{[https://huggingface.co/blog/smollm3](https://huggingface.co/blog/smollm3)}}
}