HyperAIHyperAI

Command Palette

Search for a command to run...

大语言模型 Large Language Model

Date

2 年前

大语言模型(英文:Large Language Model,缩写 LLM),也称大型语言模型,是一种人工智能算法。它应用了具有大量参数的神经网络技术,使用自监督学习技术处理和理解人类语言或文本。文本生成、机器翻译、摘要写作、从文本生成图像、机器编码、聊天机器人或对话式 AI 等任务都是大型语言模型的应用。这种 LLM 模型的例子有 open AI 的 Chat GPT 、 Google 的 BERT (Transformer 的双向编码器表示)等。

LLM 的特点是规模庞大,数十亿的参数帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种 NLP 任务上取得令人印象深刻的表现。

下图为大语言模型近几年来的发展时间线,黄色高亮标注的是已开源的大语言模型。

参考来源

https://www.geeksforgeeks.org/large-language-model-llm/?ref=lbp

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供