Command Palette
Search for a command to run...
Gemma 4 31B를 원클릭으로 배포할 수 있으며, 최대 256K 컨텍스트를 지원하고 Qwen 3.5 397B와 유사한 기능을 제공합니다.

최근에,구글 딥마인드는 젬마 4 시리즈 모델을 오픈소스로 공개했습니다.제미니 3와 동일한 기술 시스템을 활용하여, 아레나 AI 리더보드에서 전 세계 상위 3위 안에 들 뿐만 아니라, 경쟁사보다 훨씬 작은 파라미터 규모로 대규모 모델에 버금가는, 혹은 그 이상의 성능을 달성합니다. 나아가 아파치 2.0 라이선스 기반의 오픈 소스 전략을 통해 적용 진입 장벽을 더욱 낮춰 실제 운영 환경에 배포할 수 있는 잠재력을 크게 향상시켰습니다.
제품 형태의 관점에서Gemma 4는 단일 모델이 아니라 E2B, E4B, 26B, A4B부터 31B까지 다양한 크기를 지원하는 시스템입니다.이러한 모델은 모바일 기기, 로컬 배포, 고성능 컴퓨팅 환경 등 다양한 시나리오에 맞춰 설계되었습니다. 이러한 계층형 설계의 핵심은 차별화된 요구 사항을 충족하기 위해 "확장성, 성능 및 비용"의 균형을 맞추는 것입니다. 소규모 모델은 경량화 및 실시간 성능에 중점을 두는 반면, 대규모 모델은 복잡한 추론 및 고정밀 작업에 초점을 맞춥니다.
그중에서도 현행 시리즈의 최고 성능 버전인 31B는 Qwen 3.5 397B와 유사한 기능을 갖추고 있습니다. 적용 시나리오 측면에서 보면,버전 31B는 이미지 및 텍스트 입력과 출력을 지원하고, 최대 256,000개의 토큰을 표시할 수 있는 컨텍스트 창을 제공하며, 추론, 함수 호출 및 시스템 프롬프트를 기본적으로 지원합니다. 또한 140개 이상의 언어를 지원하여 고품질 질의응답, 코드 지원 및 상담원 서비스와 같은 시나리오에 매우 적합합니다.

현재 HyperAI 공식 웹사이트(hyper.ai)의 튜토리얼 섹션에서는 개발자들이 진입 장벽을 낮추고 고급 모델을 경험할 수 있도록 "Gemma-4-31B-it 원클릭 배포"를 제공하고 있습니다.
온라인으로 실행:
데모 실행
1. hyper.ai 홈페이지에 접속한 후 "튜토리얼" 페이지를 선택하거나 "더 많은 튜토리얼 보기"를 클릭하고 "Gemma-4-31B-it 원클릭 배포"를 선택한 다음 "이 튜토리얼 실행"을 클릭합니다.


2. 페이지가 리디렉션된 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.
참고: 페이지 오른쪽 상단에서 언어를 변경할 수 있습니다. 현재 중국어와 영어로만 제공됩니다. 이 튜토리얼에서는 영어로 된 단계를 안내합니다.

3. "NVIDIA RTX PRO 6000" 및 "PyTorch" 이미지를 선택하고 "작업 실행 계속"을 클릭합니다.
HyperAI는 신규 사용자를 위한 가입 보너스를 제공합니다. 단 $1로 20시간 동안 RTX 5090 컴퓨팅 파워를 이용할 수 있으며(정가는 $7), 이 리소스는 무기한으로 사용 가능합니다.


4. 리소스 할당이 완료될 때까지 기다립니다. 상태가 "실행 중"으로 변경되면 "워크스페이스 열기"를 클릭하여 Jupyter 워크스페이스에 들어갑니다.

효과 표시
1. 페이지가 리디렉션된 후 왼쪽에 있는 README 파일을 클릭하고 상단의 실행을 클릭합니다.


2. 과정이 완료되면 오른쪽에 있는 API 주소를 클릭하여 데모 페이지로 이동하세요.










