Command Palette

Search for a command to run...

2 个月前

赫尔墨斯4 技术报告

Ryan Teknium Roger Jin Jai Suphavadeeprasit Dakota Mahan Jeffrey Quesnelle Joe Li Chen Guang Shannon Sands Karan Malhotra

赫尔墨斯4 技术报告

摘要

我们提出 Hermes 4,这是一个融合结构化多轮推理能力与广泛指令遵循能力的混合推理模型系列。我们详细描述了在数据整理、数据合成、训练与评估过程中遇到的挑战,并概述了在大规模下应对这些挑战所采用的解决方案。我们在数学推理、编程、知识问答、理解能力以及对齐性等多个基准上进行了全面评估,既报告了定量性能指标,也提供了定性行为分析。为支持开放研究,所有模型权重已公开发布于 https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供