HyperAI초신경

OpenAI가 오랜 기다림 끝에 GPT-5를 발표하지 않고, 대신 두 개의 새로운 오픈소스 추론 모델인 gpt-oss-120b와 gpt-oss-20b를 공개했다. 각각 약 1170억과 210억 파라미터를 가지며, Hugging Face에서 무료로 다운로드 가능하고 Apache 2.0 라이선스 하에 상용 사용도 허용된다. 모델은 MXFP4로 최적화된 양자화 형식으로 제공되며, 120b는 단일 80GB GPU에서, 20b는 16GB 메모리로 노트북에서도 실행 가능하다. 구조는 희소 전문가(MoE) 방식을 채택해 각 토큰당 4개의 전문가를 활성화하며, 128K 길이의 컨텍스트 윈도우를 지원한다. 성능 측면에서 gpt-oss-120b는 o4-mini 수준의 추론 능력을 보이며, AIME, GPQA, MMLU 등에서 뛰어난 성과를 기록했고, SWE-bench, Codeforces 등 코드 작업에서도 높은 수준을 보였다. HealthBench에서는 GPT-4o 및 o1보다 뛰어난 성능을 나타내기도 했다. 20b 모델은 o3-mini와 비슷한 수준의 성능을 내며, 개발자들이 빠르게 실험하고 프로토타이핑할 수 있도록 설계됐다. OpenAI는 모델의 안전성을 중시해 STEM, 일반 지식, 프로그래밍 데이터에 집중하고, 위험 콘텐츠는 필터링했다. 또한 모델의 사고 과정(Chain-of-Thought)은 무 supervision 방식으로 설계해 외부 감시 시스템 구축을 유도하고, 사고 과정의 부정 사용을 탐지하는 데 기여할 수 있도록 했다. 안전성 평가 결과, 심각한 위험 능력 수준에 도달하지 않았다. 또한, 전 세계 개발자들을 대상으로 최대 50만 달러 상금의 레드팀 챌린지를 통해 보안 취약점을 발굴하도록 유도하고 있다. AWS, Azure, Databricks 등 주요 클라우드 플랫폼도 지원을 확대했다. 이번 발표는 OpenAI가 2019년 GPT-2 이후 처음으로 모델 무게를 공개한 것으로, 중국의 DeepSeek, Qwen 등 오픈소스 모델의 성장에 따른 전략적 전환으로 해석된다. 오트만 CEO는 “AI가 모든 사람에게 이롭게 쓰이도록 하기 위해, 민주적 가치 기반의 오픈 AI 스택을 만들고 싶다”며 사명을 재확인했다. 이는 AI 생태계의 접근성과 혁신을 촉진할 수 있는 중요한 전환점이다.

오픈AI, GPT-OSS 공개로 노트북에서도 대규모 모델 실행 가능

Related Links