8 个月前

Hugo Touvron* Thibaut Lavril Gautier Izacard Xavier Martinet Marie-Anne Lachaux Timothee Lacroix Baptiste Rozière Naman Goyal Eric Hambro Faisal Azhar

摘要

我们介绍了LLaMA，这是一系列基础语言模型，参数规模从70亿到650亿不等。我们的模型在数万亿个标记上进行了训练，并证明了仅使用公开可用的数据集即可训练出最先进的模型，而无需依赖专有且难以获取的数据集。特别是，LLaMA-13B在大多数基准测试中优于GPT-3（1750亿参数），而LLaMA-65B则与最佳模型Chinchilla-70B和PaLM-540B具有竞争力。我们已将所有模型发布给研究社区。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供