Command Palette

Search for a command to run...

2달 전

헤르메스 4 기술 보고서

Ryan Teknium Roger Jin Jai Suphavadeeprasit Dakota Mahan Jeffrey Quesnelle Joe Li Chen Guang Shannon Sands Karan Malhotra

헤르메스 4 기술 보고서

초록

우리는 구조화된 다단계 추론 능력과 광범위한 지시 수행 능력을 결합한 하이브리드 추론 모델인 Hermes 4를 소개한다. 데이터 수집, 통합, 훈련 및 평가 과정에서 발생한 도전 과제들을 설명하고, 이러한 과제들을 대규모로 해결하기 위해 적용한 해결 방안을 제시한다. 수학적 추론, 코딩, 지식, 이해력 및 일치성 평가 기준에 걸쳐 종합적인 평가를 수행하였으며, 정량적 성능뿐만 아니라 정성적 행동 분석 결과도 보고한다. 오픈 소스 연구를 지원하기 위해 모든 모델 가중치는 다음 링크에서 공개된다:https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
헤르메스 4 기술 보고서 | 연구 논문 | HyperAI초신경