Command Palette
Search for a command to run...
Ryan Teknium Roger Jin Jai Suphavadeeprasit Dakota Mahan Jeffrey Quesnelle Joe Li Chen Guang Shannon Sands Karan Malhotra

摘要
我们提出 Hermes 4,这是一个融合结构化多轮推理能力与广泛指令遵循能力的混合推理模型系列。我们详细描述了在数据整理、数据合成、训练与评估过程中遇到的挑战,并概述了在大规模下应对这些挑战所采用的解决方案。我们在数学推理、编程、知识问答、理解能力以及对齐性等多个基准上进行了全面评估,既报告了定量性能指标,也提供了定性行为分析。为支持开放研究,所有模型权重已公开发布于 https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728。