HyperAIHyperAI

Command Palette

Search for a command to run...

GPT-NeoX-20B:一个开源的自回归语言模型

摘要

我们介绍了一种名为GPT-NeoX-20B的自回归语言模型,该模型拥有200亿个参数,并在Pile数据集上进行了训练。我们将通过一个宽松的许可协议,将该模型的权重免费且公开地提供给公众。据我们所知,在提交时,这是目前公开权重的最大规模的密集自回归模型。在这项工作中,我们描述了GPT-NeoX-20B的架构和训练过程,并对其在一系列语言理解、数学和知识型任务上的性能进行了评估。我们发现,GPT-NeoX-20B在少量样本推理方面表现出色,在五次提示评估中的性能提升远超同样规模的GPT-3和FairSeq模型。我们已将训练和评估代码以及模型权重开源,具体地址为:https://github.com/EleutherAI/gpt-neox


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供