Command Palette

Search for a command to run...

DeepSeek-V2-Lite-Chat의 원클릭 배포

이 튜토리얼은 DeepSeek-V2-Lite-Chat의 원클릭 배포 데모입니다. 컨테이너를 복제하고 시작하고, 생성된 API 주소를 직접 복사하기만 하면 모델의 추론을 경험할 수 있습니다.

1. 모델 소개

DeepSeek-V2는 경제적인 학습과 효율적인 추론을 특징으로 하는 강력한 전문가 혼합(MoE) 언어 모델입니다. 총 236B개의 매개변수가 포함되어 있으며, 각 토큰은 21B개의 매개변수를 활성화합니다. DeepSeek 67B와 비교했을 때 DeepSeek-V2는 학습 비용을 42.5% 절감하고, KV 캐시를 93.3% 줄이고, 최대 생성 처리량을 5.76배 증가시키는 동시에 더 강력한 성능을 달성했습니다.

2. 평가 결과

기준도메인QWen1.5 72B 채팅믹스트랄 8x22BLLaMA3 70B 지시DeepSeek-V1 채팅(SFT)DeepSeek-V2 채팅(SFT)DeepSeek-V2 채팅(RL)
MMLU영어76.277.880.371.178.477.8
비비에이치영어65.978.480.171.781.379.7
C-평가영어82.260.067.965.280.978.0
CMMLU영어82.961.070.767.882.481.6
휴먼에벌암호68.975.076.273.876.881.1
MBPP암호52.264.469.861.470.472.0
라이브코드벤치(0901-0401)암호18.825.030.518.328.732.5
GSM8K수학81.987.993.284.190.892.2
수학수학40.649.848.532.652.753.9

3. 사용 방법

이 튜토리얼에서는 모델과 환경을 배포했습니다. 튜토리얼의 설명에 따라 추론 대화를 위해 대형 모델을 직접 사용할 수 있습니다. 구체적인 튜토리얼은 다음과 같습니다.

1단계: 컨테이너 복제 및 시작

컨테이너를 성공적으로 복제하고 시작하면 이 인터페이스가 표시됩니다. 모델이 로드될 때까지 12초 정도 기다린 후 오른쪽에 있는 API 주소를 브라우저에 복사합니다. 

2단계: 웹사이트에 들어가기

웹페이지에 접속 후, 대형 모델과 통신이 가능합니다.(관련 매개변수는 디버깅이 완료되어 별도의 조정이 필요하지 않습니다.) 

토론 및 교류

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔 및 [튜토리얼 교환]에 댓글을 남겨 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp