Command Palette
Search for a command to run...
Qwen3-4B-2507의 원클릭 배포
GPU 컴퓨팅 에어드롭
1. 튜토리얼 소개

Qwen3-4B-Thinking-2507과 Qwen3-4B-Instruct-2507은 알리바바의 통이첸원(Tongyi Qianwen) 팀이 2025년 8월에 출시한 대규모 언어 모델입니다. 성능 면에서 Qwen3-4B-Thinking-2507은 복잡한 문제 추론, 수학적 능력, 코딩 능력, 다중 턴 함수 호출 기능에서 유사한 규모의 소형 Qwen3 모델들을 크게 능가합니다. 비추론 영역에서는 지식, 추론, 프로그래밍, 정렬, 행위자성 능력 면에서 클로즈드 소스 소형 모델인 GPT-4.1-nano를 종합적으로 뛰어넘으며, 중형 모델인 Qwen3-30B-A3B(비사고형)와 유사한 성능을 보입니다. 이 모델은 더 광범위한 롱테일 언어 지식을 포괄하고, 주관적이고 개방형 작업에서 인간의 선호도와의 정렬을 강화하며, 더 관련성 높은 응답을 제공할 수 있습니다. 관련 논문 결과는 다음과 같습니다... Qwen3 기술 보고서 .
이 튜토리얼에서는 듀얼 카드 RTX 4090 리소스를 사용합니다.
2. 프로젝트 예시
Qwen3-4B-생각-2507

Qwen3-4B-Instruct-2507

3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.
"모델"이 표시되지 않으면 모델이 초기화 중임을 의미합니다. 모델이 용량이 크므로 2~3분 정도 기다린 후 페이지를 새로고침해 주세요.
사용 방법
Qwen3-4B-생각-2507

Qwen3-4B-Instruct-2507

4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@misc{qwen3technicalreport,
title={Qwen3 Technical Report},
author={Qwen Team},
year={2025},
eprint={2505.09388},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2505.09388},
}