HyperAIHyperAI

Command Palette

Search for a command to run...

Mistral AI发布7B参数开源模型,挑战生成式AI寡头垄断

生成式人工智能,尤其是大规模语言模型,正在通过基于人类指令生成高质量的文本、内容和命令,重新定义内容创作、知识检索和问题解决。未来几年,生成式AI将彻底改变我们的文化、生活以及与机器和他人的互动方式。 目前,大型科技公司首先推出了专有解决方案,展示了生成式模型的潜力。然而,像Web、浏览器(如Webkit)、操作系统(如Linux)和云编排(如Kubernetes)一样,开放解决方案将很快在大多数应用场景中超越专有解决方案。开放模型由社区支持,通过技术卓越和社区力量,能够有效减少审查和偏见,从而塑造我们的未来。 Mistral AI的使命是推动开放模型的革命。该团队坚信通过自己训练模型、公开发布并促进社区贡献,可以构建出专有AI模型的可靠替代品。开放模型将在许多不同的行业领域中发挥关键作用,为各种特定任务开发出高度定制化的解决方案,并在减少生成式AI的误用方面提供重要保障。 2023年7月,Mistral AI发布了其首款70亿参数的开放模型Mistral 7B,该模型在所有标准的英文和代码基准测试中,表现优于所有已有的最多130亿参数的开放模型。这一成就是在三个月的高强度工作中实现的,团队重新构建了高性能的机器学习操作栈,并设计了复杂的数据处理管道。Mistral 7B的性能展示了小型模型在足够投入下的巨大潜力。通过对比2021年DeepMind的Gopher(2800亿参数)、2022年的Chinchilla(700亿参数)和2023年7月Meta的Llama 2(340亿参数),我们发现Mistral 7B在两年内取得了显著进步。 Mistral 7B不仅能用于许多任务,如总结、结构化和问答,还比大型专有解决方案处理和生成文本速度快得多,且运行成本更低。该模型采用Apache 2.0许可证发布,允许在任何地方无限制使用。 接下来,Mistral AI将开放GitHub仓库和Discord频道,以促进与用户社区的互动,推动负责任的模型和工具使用。团队承诺将同时开发商业产品和开源模型,提供经过优化的专有模型用于本地或虚拟私有云部署。这些模型将以白盒解决方案的形式发布,包括权重和源代码。Mistral AI正在训练更大的模型,并探索新的架构,预计在今年秋天会有更多发布。 业内人士认为,Mistral AI的举措将为生成式AI的研发和应用注入新的活力。通过开放模型,不仅能够加快技术创新的步伐,还能减少技术霸权和监督滥用的风险。Mistral AI作为一家专注于社区驱动和开源技术的初创公司,有望在生成式AI领域引领新的发展方向。

相关链接

Mistral AI发布7B参数开源模型,挑战生成式AI寡头垄断 | 热门资讯 | HyperAI超神经