HyperAI초신경

DeepSeek-R1-0528-Qwen3-8B의 원클릭 배포

1. 튜토리얼 소개

이 튜토리얼에서 사용된 컴퓨팅 리소스는 RTX 4090 카드 1개입니다.

DeepSeek-R1-0528-Qwen3-8B는 DeepSeek 팀에서 2025년 5월에 출시했습니다. 이는 DeepSeek-R1-0528의 사고 사슬 증류 기술을 기반으로 훈련된 가벼운 추론 모델입니다. 이 모델은 80억 개의 매개변수를 가지고 있습니다. DeepSeek-R1-0528의 복잡한 추론 기능을 더 작은 Qwen3-8B 기반 모델에 집약하여 Qwen3의 다국어 기능과 DeepSeek-R1의 추론 최적화 기능을 결합했습니다. GPT-4와 비슷한 성능을 제공하며, 효율적인 단일 카드 배포를 지원하므로 학술 및 기업용 애플리케이션에 이상적인 선택입니다. AIME 2024에서 DeepSeek-R1-0528-Qwen3-8B는 오픈 소스 모델 중 최고의 성능(SOTA)을 달성하여 Qwen3 8B +10.0%를 능가했으며, Qwen3-235B-thinking의 성능과 비슷했습니다.

2. 프로젝트 예시

3. 작업 단계

1. 컨테이너를 시작하세요

"모델"이 표시되지 않으면 모델이 초기화되고 있음을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.

4. 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@misc{deepseekai2025deepseekr1incentivizingreasoningcapability,
      title={DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning}, 
      author={DeepSeek-AI},
      year={2025},
      eprint={2501.12948},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2501.12948}, 
}