大语言模型 Large Language Model
大语言模型(英文:Large Language Model,缩写 LLM),也称大型语言模型,是一种人工智能算法。它应用了具有大量参数的神经网络技术,使用自监督学习技术处理和理解人类语言或文本。文本生成、机器翻译、摘要写作、从文本生成图像、机器编码、聊天机器人或对话式 AI 等任务都是大型语言模型的应用。这种 LLM 模型的例子有 open AI 的 Chat GPT 、 Google 的 BERT (Transformer 的双向编码器表示)等。
LLM 的特点是规模庞大,数十亿的参数帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种 NLP 任务上取得令人印象深刻的表现。
下图为大语言模型近几年来的发展时间线,黄色高亮标注的是已开源的大语言模型。

参考来源
https://www.geeksforgeeks.org/large-language-model-llm/?ref=lbp