HyperAIHyperAI

Command Palette

Search for a command to run...

从大模型到幻觉:常见 AI 术语通俗指南

人工智能领域术语繁多,为帮助大众理解,本文梳理了关键概念。AGI(通用人工智能)指在多数任务上媲美甚至超越人类的自主系统。AI 智能体则是能独立执行订票、写代码等多步骤任务的工具。链式思考要求模型像人一样拆解问题步骤,以提升逻辑和编码任务的准确率。 训练与推理是核心流程:训练即喂入数据让模型学习规律,而推理则是模型应用所学进行预测。大语言模型(LLM)基于数十亿参数构建,通过预测下一个词来生成文本。幻觉指模型生成虚假信息的问题,源于训练数据不足,正促使行业转向垂直领域专用模型。 技术实现方面,深度学习利用多层神经网络模拟人脑,擅长自动识别数据特征。扩散模型通过“去噪”过程生成图像或文本。微调是在大模型基础上针对特定任务进行的二次训练,而知识蒸馏则是用大模型(教师)指导小模型(学生)学习,以打造更高效的版本。生成对抗网络通过两个模型的博弈来生成逼真内容。 硬件层面,算力(Compute)指支持模型运行的芯片如 GPU,而内存危机(RAMageddon)因 AI 对内存需求激增导致全球供应紧张。为了优化效率,缓存技术可保存常用计算结果。在商业应用中,Token(词元)是数据处理的基本单位,服务费用通常按 Token 用量计费。权重则是决定模型关注数据哪些特征的数值参数,随训练不断调整。这些基础术语构成了理解当前 AI 技术发展的关键。

相关链接