Command Palette
Search for a command to run...
vLLM+Open WebUI 배포 QwenLong-L1-32B
GPU 컴퓨팅 에어드롭
1. 튜토리얼 소개

QwenLong-L1-32B는 2025년 5월 26일 Tongyi Lab과 Alibaba Group이 공동 개발한 장문 텍스트 추론 모델입니다. 이 모델은 강화 학습(RL)을 사용하여 학습된 최초의 장문 텍스트 추론 모델로, 기존의 대규모 모델이 매우 긴 문맥(예: 12만 토큰)을 처리할 때 발생하는 메모리 부족 및 논리적 불일치와 같은 문제를 해결하는 데 중점을 두었습니다. 기존 대규모 모델의 문맥 제약을 뛰어넘어 금융 및 법률과 같은 고정밀 시나리오에 저비용 고성능 솔루션을 제공합니다. 관련 연구 논문은 온라인에서 확인할 수 있습니다. QwenLong-L1: 강화 학습을 통한 장문맥 대규모 추론 모델 구축 .
이 튜토리얼에서는 듀얼 카드 RTX A6000 리소스를 사용합니다.
2. 프로젝트 예시

3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.
"모델"이 표시되지 않으면 모델이 초기화되고 있음을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.
사용 방법

4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
Github 사용자에게 감사드립니다 xxxjjjyyy1 이 튜토리얼의 배포. 이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@article{wan2025qwenlongl1,
title={QwenLong-L1: : Towards Long-Context Large Reasoning Models with Reinforcement Learning},
author={Fanqi Wan, Weizhou Shen, Shengyi Liao, Yingcheng Shi, Chenliang Li, Ziyi Yang, Ji Zhang, Fei Huang, Jingren Zhou, Ming Yan},
journal={arXiv preprint arXiv:2505.17667},
year={2025}
}