HyperAIHyperAI

Command Palette

Search for a command to run...

튜토리얼 요약 | 오픈 소스 소형 모델이 GPT-5와 유사한 전반적인 지능을 달성합니다. Qwen 3.5/Gemma 4와 같은 인기 모델에 대한 종합적인 평가를 제공합니다.

Featured Image

4월 14일, 제3자 테스트 기관인 Artificial Analysis는 32바이트 미만의 오픈 소스 모델에 대한 비교 보고서를 발표했는데, 그 내용은 다음과 같습니다...소형 모델인 Qwen3.5 27B와 Gemma 4 31B는 전반적인 지능 면에서 해당 GPT-5에 필적하는 수준에 도달했습니다.그중 Qwen3.5 27B(추론 버전)는 지능 지수에서 42점을 기록하여 GPT-5(중간)와 비슷한 수준이며, Gemma 4 31B(추론 버전)는 39점을 기록하여 GPT-5(낮음)와 동일한 수준입니다.

보고서에 따르면 이번 32B 세대 모델은 추론 능력과 에이전트 성능에서 상당한 개선을 보였습니다. Qwen3.5 27B는 Agentic Index에서 55점을 획득하여 GPT-5(중간 난이도)의 46점을 넘어섰습니다. Gemma 4 31B 또한 TerminalBench Hard 및 HLE와 같은 복잡한 작업에서 GPT-5(낮음 난이도)보다 우수한 성능을 보였습니다. 또한 두 모델 모두 멀티모달 입력을 기본적으로 지원하며 MMMU-Pro와 같은 시각 이해 작업에서 동급 최고의 오픈 소스 모델 중 하나로 평가됩니다.

하지만 더 작은 모델은 지식 정확도와 착각 제어 측면에서 여전히 크게 뒤처진다. 두 모델은 AA-Omniscience 지수에서 각각 -42와 -45점을 기록했고, GPT-5 관련 버전은 -10점을 기록하여 매개변수 크기가 지식 보유 능력에 지속적인 영향을 미친다는 것을 보여준다.

배포 수준에서 이러한 모델의 실용성이 크게 향상되었습니다. 앞서 언급한 두 모델 모두 NVIDIA H100 단일 그래픽 카드에서 실행 가능하며, 양자화를 통해 개인 기기에 로컬로 배포할 수 있어 진입 장벽이 낮아졌습니다. 또한, 오픈 소스 가중치 커뮤니티 전체가 빠르게 발전하고 있으며, GLM-5.1과 같은 대규모 모델의 경우 격차가 한 자릿수로 좁혀지고 있습니다.

쭉,HyperAI는 개발자들이 최신 오픈 소스 모델을 빠르게 시작하고 검증할 수 있도록 공식 웹사이트의 "튜토리얼" 섹션에서 인기 모델에 대한 온라인 배포 노트북을 지속적으로 업데이트하고 있습니다.이 글에서는 Artificial Analysis 보고서에 언급된 고품질 오픈 소스 모델과 원클릭 배포 튜토리얼을 요약합니다. 폐쇄형 소스 모델에 버금가는 고성능을 직접 경험해 보세요!

더 많은 온라인 튜토리얼:

https://hyper.ai/notebooks

더 자세한 정보를 원하시면 저희 공식 웹사이트를 방문해 주세요.

https://hyper.ai

NVIDIA-Nemotron-3-Super-120B

NVIDIA Nemotron 3 Super NVFP4는 NVIDIA Corporation에서 2026년 3월에 출시했습니다. 이 모델은 총 120개의 파라미터와 12개의 활성화 파라미터를 가진 대규모 언어 모델로, LatentMoE 하이브리드 아키텍처를 사용하며 최대 100만 개의 토큰을 지원하는 컨텍스트를 제공합니다.

이 모델은 장기적인 맥락 추론, 에이전트 워크플로, 도구 호출, RAG(추론 기반 알고리즘) 및 높은 처리량의 질의응답과 관련된 시나리오를 위해 설계되었습니다. 상호 작용 측면에서 이 모델은 추론 모드 활성화 및 비활성화를 모두 지원하며, 표준화된 채팅 템플릿 매개변수를 사용하여 일반 질의응답 모드와 추론 강화 모드 간에 전환할 수 있습니다.

온라인으로 실행:

https://go.hyper.ai/WJmbe

데모 페이지

Qwen3.5-27B-Claude-4.6-Opus추론의 핵심

2026년 3월, Jackrong은 고성능 추론 모델인 Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled를 오픈소스로 공개했습니다. 이 모델은 Qwen3.5-27B 아키텍처를 기반으로 Claude-4.6 및 Opus에서 추출한 고급 추론 기능을 통합했습니다. 기존의 강력한 언어 이해 및 표현 기능을 유지하면서 복잡한 문제 해결 및 다단계 대화 상호 작용 성능을 크게 향상시켰습니다.

이 모델은 핵심 기능 수준에서 고품질 사고 연쇄 추출 기술을 도입하여 추론 능력을 종합적으로 향상시켰으며, 수학적 유도, 논리 분석, 계획 및 의사 결정, 다단계 작업 분해와 같은 시나리오에서 특히 뛰어난 성능을 발휘합니다. 기존 모델과 비교했을 때, 이 시스템은 단순히 답을 도출하는 것을 넘어 구조화된 방식으로 문제를 단계별로 분석하고 복잡한 작업을 명확하고 실행 가능한 논리적 단계로 분해하여 전반적인 추론 안정성과 결과의 신뢰성을 향상시킵니다.

온라인으로 실행:

https://go.hyper.ai/PTR8m

데모 페이지

젬마-4-31B-it

구글 딥마인드의 오픈소스 모델인 젬마 4 시리즈는 제미니 3와 동일한 기술 시스템을 기반으로 하며, 아레나 AI 순위표에서 상위 3위 안에 들었을 뿐만 아니라 경쟁사보다 훨씬 작은 파라미터 규모로 대형 모델에 근접하거나 그 이상의 성능을 달성했습니다.

제품 형태 측면에서 Gemma 4는 단일 모델이 아니라 E2B, E4B, 26B, A4B, 31B 등 다양한 크기로 제공되는 시스템으로, 모바일 기기, 로컬 배포, 고성능 컴퓨팅 환경 등 다양한 시나리오에 대응합니다. 그중에서도 현재 시리즈의 최고 성능 버전인 31B는 Qwen 3.5 397B에 필적하는 수준의 성능을 자랑합니다.

적용 시나리오 측면에서 버전 31B는 이미지 및 텍스트 입력과 출력을 지원하고, 최대 256,000개의 토큰을 표시할 수 있는 컨텍스트 창을 제공하며, 추론, 함수 호출 및 시스템 프롬프트를 기본적으로 지원합니다. 또한 140개 이상의 언어를 지원하므로 고품질 질의응답, 코드 지원 및 상담원 서비스와 같은 시나리오에서 뛰어난 성능을 발휘합니다.

온라인으로 실행:

https://go.hyper.ai/NzyGq

데모 페이지

CPU 배포 Qwen3.5-9B-GGUF

Qwen3.5는 알리바바 통이첸원(Tongyi Qianwen) 팀에서 출시한 차세대 멀티모달 대규모 언어 모델 시리즈입니다. 텍스트와 이미지 입력을 지원하고 텍스트 출력을 생성하며, 대화, 추론, 프로그래밍, 시각적 이해 등의 작업에 적합합니다. 그중 Qwen3.5-9B는 90억 개의 파라미터를 지원하는 버전으로, 성능과 구축 비용의 균형을 맞춰 리소스가 제한된 환경의 엣지 또는 로컬 배포 추론에 적합합니다.

이 튜토리얼에서는 커뮤니티에서 제공하는 GGUF 가중치(Q4_K_M 양자화 버전)와 시각적 인코더(mmproj GGUF 파일)를 함께 사용합니다. llama.cpp를 통해 OpenAI 인터페이스와 호환되는 백엔드 서비스를 시작하고 OpenWebUI에 연결하여 브라우저 기반의 대화형 인터페이스를 제공합니다.

온라인으로 실행:

https://go.hyper.ai/sT3nm

더 많은 인기 튜토리얼을 찾아보세요:

https://hyper.ai/notebooks