Gemma 4 31B를 원클릭으로 배포할 수 있으며, 최대 256K 컨텍스트를 지원하고 Qwen 3.5 397B와 유사한 기능을 제공합니다.

최근에,구글 딥마인드는 젬마 4 시리즈 모델을 오픈소스로 공개했습니다.제미니 3와 동일한 기술 시스템을 활용하여, 아레나 AI 리더보드에서 전 세계 상위 3위 안에 들 뿐만 아니라, 경쟁사보다 훨씬 작은 파라미터 규모로 대규모 모델에 버금가는, 혹은 그 이상의 성능을 달성합니다. 나아가 아파치 2.0 라이선스 기반의 오픈 소스 전략을 통해 적용 진입 장벽을 더욱 낮춰 실제 운영 환경에 배포할 수 있는 잠재력을 크게 향상시켰습니다.

제품 형태의 관점에서Gemma 4는 단일 모델이 아니라 E2B, E4B, 26B, A4B부터 31B까지 다양한 크기를 지원하는 시스템입니다.이러한 모델은 모바일 기기, 로컬 배포, 고성능 컴퓨팅 환경 등 다양한 시나리오에 맞춰 설계되었습니다. 이러한 계층형 설계의 핵심은 차별화된 요구 사항을 충족하기 위해 "확장성, 성능 및 비용"의 균형을 맞추는 것입니다. 소규모 모델은 경량화 및 실시간 성능에 중점을 두는 반면, 대규모 모델은 복잡한 추론 및 고정밀 작업에 초점을 맞춥니다.

그중에서도 현행 시리즈의 최고 성능 버전인 31B는 Qwen 3.5 397B와 유사한 기능을 갖추고 있습니다. 적용 시나리오 측면에서 보면,버전 31B는 이미지 및 텍스트 입력과 출력을 지원하고, 최대 256,000개의 토큰을 표시할 수 있는 컨텍스트 창을 제공하며, 추론, 함수 호출 및 시스템 프롬프트를 기본적으로 지원합니다. 또한 140개 이상의 언어를 지원하여 고품질 질의응답, 코드 지원 및 상담원 서비스와 같은 시나리오에 매우 적합합니다.

현재 HyperAI 공식 웹사이트(hyper.ai)의 튜토리얼 섹션에서는 개발자들이 진입 장벽을 낮추고 고급 모델을 경험할 수 있도록 "Gemma-4-31B-it 원클릭 배포"를 제공하고 있습니다.

온라인으로 실행:

https://go.hyper.ai/NzyGq

데모 실행

1. hyper.ai 홈페이지에 접속한 후 "튜토리얼" 페이지를 선택하거나 "더 많은 튜토리얼 보기"를 클릭하고 "Gemma-4-31B-it 원클릭 배포"를 선택한 다음 "이 튜토리얼 실행"을 클릭합니다.

2. 페이지가 리디렉션된 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.

참고: 페이지 오른쪽 상단에서 언어를 변경할 수 있습니다. 현재 중국어와 영어로만 제공됩니다. 이 튜토리얼에서는 영어로 된 단계를 안내합니다.

3. "NVIDIA RTX PRO 6000" 및 "PyTorch" 이미지를 선택하고 "작업 실행 계속"을 클릭합니다.

HyperAI는 신규 사용자를 위한 가입 보너스를 제공합니다. 단 $1로 20시간 동안 RTX 5090 컴퓨팅 파워를 이용할 수 있으며(정가는 $7), 이 리소스는 무기한으로 사용 가능합니다.

4. 리소스 할당이 완료될 때까지 기다립니다. 상태가 "실행 중"으로 변경되면 "워크스페이스 열기"를 클릭하여 Jupyter 워크스페이스에 들어갑니다.

효과 표시

1. 페이지가 리디렉션된 후 왼쪽에 있는 README 파일을 클릭하고 상단의 실행을 클릭합니다.

2. 과정이 완료되면 오른쪽에 있는 API 주소를 클릭하여 데모 페이지로 이동하세요.

HyperAI

Gemma 4 31B를 원클릭으로 배포할 수 있으며, 최대 256K 컨텍스트를 지원하고 Qwen 3.5 397B와 유사한 기능을 제공합니다.

3달 전

온라인으로 실행:

https://go.hyper.ai/NzyGq

데모 실행

2. 페이지가 리디렉션된 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.

참고: 페이지 오른쪽 상단에서 언어를 변경할 수 있습니다. 현재 중국어와 영어로만 제공됩니다. 이 튜토리얼에서는 영어로 된 단계를 안내합니다.

3. "NVIDIA RTX PRO 6000" 및 "PyTorch" 이미지를 선택하고 "작업 실행 계속"을 클릭합니다.

4. 리소스 할당이 완료될 때까지 기다립니다. 상태가 "실행 중"으로 변경되면 "워크스페이스 열기"를 클릭하여 Jupyter 워크스페이스에 들어갑니다.

효과 표시

1. 페이지가 리디렉션된 후 왼쪽에 있는 README 파일을 클릭하고 상단의 실행을 클릭합니다.

2. 과정이 완료되면 오른쪽에 있는 API 주소를 클릭하여 데모 페이지로 이동하세요.

Gemma 4 31B를 원클릭으로 배포할 수 있으며, 최대 256K 컨텍스트를 지원하고 Qwen 3.5 397B와 유사한 기능을 제공합니다.

3달 전

온라인으로 실행:

https://go.hyper.ai/NzyGq

데모 실행

2. 페이지가 리디렉션된 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.

참고: 페이지 오른쪽 상단에서 언어를 변경할 수 있습니다. 현재 중국어와 영어로만 제공됩니다. 이 튜토리얼에서는 영어로 된 단계를 안내합니다.

3. "NVIDIA RTX PRO 6000" 및 "PyTorch" 이미지를 선택하고 "작업 실행 계속"을 클릭합니다.

4. 리소스 할당이 완료될 때까지 기다립니다. 상태가 "실행 중"으로 변경되면 "워크스페이스 열기"를 클릭하여 Jupyter 워크스페이스에 들어갑니다.

효과 표시

1. 페이지가 리디렉션된 후 왼쪽에 있는 README 파일을 클릭하고 상단의 실행을 클릭합니다.

2. 과정이 완료되면 오른쪽에 있는 API 주소를 클릭하여 데모 페이지로 이동하세요.

Command Palette

Gemma 4 31B를 원클릭으로 배포할 수 있으며, 최대 256K 컨텍스트를 지원하고 Qwen 3.5 397B와 유사한 기능을 제공합니다.

Command Palette

Gemma 4 31B를 원클릭으로 배포할 수 있으며, 최대 256K 컨텍스트를 지원하고 Qwen 3.5 397B와 유사한 기능을 제공합니다.

관련 뉴스

온라인 튜토리얼 | 16GB 노트북, 혁신적인 아키텍처를 기반으로 텍스트/이미지/사운드 모달리티 통합 처리 기능을 통해 거의 26B MoE 성능 달성: Gemma 4 12B

온라인 튜토리얼 | 작은 크기, 강력한 코드 성능: Qwen3.6-27B, 플래그십 수준의 프로그래밍 기능 구현

온라인 튜토리얼 | 소형 9B 모델로도 복잡한 추론 가능: Qwen 3.5-9B 기반의 Qwythos는 Claude의 추론 경험을 통합하여 기능을 획기적으로 향상시켰습니다.

온라인 튜토리얼 | 최대 4배 빠른 생성 속도: DiffusionGemma는 다중 라운드 병렬 노이즈 제거 기반의 지속적인 최적화를 통해 전체 텍스트 블록을 동시에 생성할 수 있습니다.

온라인 튜토리얼 | 명령 추종/추론/코딩에 대한 심층 가이드: Mistral Medium 3.5, 클라우드 환경에서 코딩 에이전트 구현

무료 CPU 온라인 튜토리얼 | Hermes 에이전트: 장기 기억 학습? TencentDB Agent Memory 메모리 향상 플러그인은 사실, 선호도, 작업 상태 등을 별도로 저장할 수 있습니다.

이모티콘으로 음성 생성을 제어할 수 있을까요? Irodori-TTS는 RF-DiT 아키텍처 기반의 일본어 TTS입니다. 습진 및 백선 피부 질환 데이터 세트: 의료 영상 분류 및 전이 학습을 지원합니다.

온라인 튜토리얼 | 단일 SIM 카드로 대규모 수정: MiniCPM-V-4.6, 1.3B 오픈 소스 모델은 이미지 이해/비디오 이해/OCR/다중 턴 멀티모달 대화(Wallfacer 및 기타 오픈 소스 라이브러리 사용)를 지원합니다.

4단계 이미지 출력/4K 화질/6배속 향상, PiD는 픽셀 확산을 사용하여 디코딩과 초해상도 출력을 통합합니다. SA-3DAO: 아티스트가 직접 제작한 3D 메시와 실제 이미지 1000쌍을 포함하는 데이터셋입니다.

Command Palette

Gemma 4 31B를 원클릭으로 배포할 수 있으며, 최대 256K 컨텍스트를 지원하고 Qwen 3.5 397B와 유사한 기능을 제공합니다.

관련 뉴스

온라인 튜토리얼 | 16GB 노트북, 혁신적인 아키텍처를 기반으로 텍스트/이미지/사운드 모달리티 통합 처리 기능을 통해 거의 26B MoE 성능 달성: Gemma 4 12B

온라인 튜토리얼 | 작은 크기, 강력한 코드 성능: Qwen3.6-27B, 플래그십 수준의 프로그래밍 기능 구현

온라인 튜토리얼 | 소형 9B 모델로도 복잡한 추론 가능: Qwen 3.5-9B 기반의 Qwythos는 Claude의 추론 경험을 통합하여 기능을 획기적으로 향상시켰습니다.

온라인 튜토리얼 | 최대 4배 빠른 생성 속도: DiffusionGemma는 다중 라운드 병렬 노이즈 제거 기반의 지속적인 최적화를 통해 전체 텍스트 블록을 동시에 생성할 수 있습니다.

온라인 튜토리얼 | 명령 추종/추론/코딩에 대한 심층 가이드: Mistral Medium 3.5, 클라우드 환경에서 코딩 에이전트 구현

무료 CPU 온라인 튜토리얼 | Hermes 에이전트: 장기 기억 학습? TencentDB Agent Memory 메모리 향상 플러그인은 사실, 선호도, 작업 상태 등을 별도로 저장할 수 있습니다.

이모티콘으로 음성 생성을 제어할 수 있을까요? Irodori-TTS는 RF-DiT 아키텍처 기반의 일본어 TTS입니다. 습진 및 백선 피부 질환 데이터 세트: 의료 영상 분류 및 전이 학습을 지원합니다.

온라인 튜토리얼 | 단일 SIM 카드로 대규모 수정: MiniCPM-V-4.6, 1.3B 오픈 소스 모델은 이미지 이해/비디오 이해/OCR/다중 턴 멀티모달 대화(Wallfacer 및 기타 오픈 소스 라이브러리 사용)를 지원합니다.

4단계 이미지 출력/4K 화질/6배속 향상, PiD는 픽셀 확산을 사용하여 디코딩과 초해상도 출력을 통합합니다. SA-3DAO: 아티스트가 직접 제작한 3D 메시와 실제 이미지 1000쌍을 포함하는 데이터셋입니다.

관련 뉴스

온라인 튜토리얼 | 16GB 노트북, 혁신적인 아키텍처를 기반으로 텍스트/이미지/사운드 모달리티 통합 처리 기능을 통해 거의 26B MoE 성능 달성: Gemma 4 12B

온라인 튜토리얼 | 작은 크기, 강력한 코드 성능: Qwen3.6-27B, 플래그십 수준의 프로그래밍 기능 구현

온라인 튜토리얼 | 소형 9B 모델로도 복잡한 추론 가능: Qwen 3.5-9B 기반의 Qwythos는 Claude의 추론 경험을 통합하여 기능을 획기적으로 향상시켰습니다.

온라인 튜토리얼 | 최대 4배 빠른 생성 속도: DiffusionGemma는 다중 라운드 병렬 노이즈 제거 기반의 지속적인 최적화를 통해 전체 텍스트 블록을 동시에 생성할 수 있습니다.

온라인 튜토리얼 | 명령 추종/추론/코딩에 대한 심층 가이드: Mistral Medium 3.5, 클라우드 환경에서 코딩 에이전트 구현

무료 CPU 온라인 튜토리얼 | Hermes 에이전트: 장기 기억 학습? TencentDB Agent Memory 메모리 향상 플러그인은 사실, 선호도, 작업 상태 등을 별도로 저장할 수 있습니다.

이모티콘으로 음성 생성을 제어할 수 있을까요? Irodori-TTS는 RF-DiT 아키텍처 기반의 일본어 TTS입니다. 습진 및 백선 피부 질환 데이터 세트: 의료 영상 분류 및 전이 학습을 지원합니다.

온라인 튜토리얼 | 단일 SIM 카드로 대규모 수정: MiniCPM-V-4.6, 1.3B 오픈 소스 모델은 이미지 이해/비디오 이해/OCR/다중 턴 멀티모달 대화(Wallfacer 및 기타 오픈 소스 라이브러리 사용)를 지원합니다.

4단계 이미지 출력/4K 화질/6배속 향상, PiD는 픽셀 확산을 사용하여 디코딩과 초해상도 출력을 통합합니다. SA-3DAO: 아티스트가 직접 제작한 3D 메시와 실제 이미지 1000쌍을 포함하는 데이터셋입니다.

관련 뉴스

온라인 튜토리얼 | 16GB 노트북, 혁신적인 아키텍처를 기반으로 텍스트/이미지/사운드 모달리티 통합 처리 기능을 통해 거의 26B MoE 성능 달성: Gemma 4 12B

온라인 튜토리얼 | 작은 크기, 강력한 코드 성능: Qwen3.6-27B, 플래그십 수준의 프로그래밍 기능 구현

온라인 튜토리얼 | 소형 9B 모델로도 복잡한 추론 가능: Qwen 3.5-9B 기반의 Qwythos는 Claude의 추론 경험을 통합하여 기능을 획기적으로 향상시켰습니다.

온라인 튜토리얼 | 최대 4배 빠른 생성 속도: DiffusionGemma는 다중 라운드 병렬 노이즈 제거 기반의 지속적인 최적화를 통해 전체 텍스트 블록을 동시에 생성할 수 있습니다.

온라인 튜토리얼 | 명령 추종/추론/코딩에 대한 심층 가이드: Mistral Medium 3.5, 클라우드 환경에서 코딩 에이전트 구현

무료 CPU 온라인 튜토리얼 | Hermes 에이전트: 장기 기억 학습? TencentDB Agent Memory 메모리 향상 플러그인은 사실, 선호도, 작업 상태 등을 별도로 저장할 수 있습니다.

이모티콘으로 음성 생성을 제어할 수 있을까요? Irodori-TTS는 RF-DiT 아키텍처 기반의 일본어 TTS입니다. 습진 및 백선 피부 질환 데이터 세트: 의료 영상 분류 및 전이 학습을 지원합니다.

온라인 튜토리얼 | 단일 SIM 카드로 대규모 수정: MiniCPM-V-4.6, 1.3B 오픈 소스 모델은 이미지 이해/비디오 이해/OCR/다중 턴 멀티모달 대화(Wallfacer 및 기타 오픈 소스 라이브러리 사용)를 지원합니다.

4단계 이미지 출력/4K 화질/6배속 향상, PiD는 픽셀 확산을 사용하여 디코딩과 초해상도 출력을 통합합니다. SA-3DAO: 아티스트가 직접 제작한 3D 메시와 실제 이미지 1000쌍을 포함하는 데이터셋입니다.