Command Palette
Search for a command to run...
百科
我们编汇了数百条相关词条,帮助您理解「人工智能」
Search for a command to run...
我们编汇了数百条相关词条,帮助您理解「人工智能」
多模态大语言模型将自然语言处理 (NLP) 的功能与图像、音频或视频等其他模态相结合。
与其他使用专家混合的 LLM 升级方法相比,DUS 不需要进行复杂的更改即可有效地训练和推理。
在深度学习领域中,Grokking 现象指的是神经网络在训练过程中的一种现象,即在训练误差衰减很长时间后仍能实现良好的泛化。
深度学习中的 Scaling Law 指的是感兴趣的功能性属性(通常是测试损失或微调任务的某些性能指标)与体系结构或优化过程的属性之间的关系(如模型大小、宽度或训练计算)。
涌现 (Emergence) 在人工智能领域指的是一种现象,即通过简单的个体或规则相互作用而产生复杂的集体行为或结构。在人工智能中,这种 Emergence 可以指模型学习到的高级特征或行为,这些特征或行为不是直接由设计 […]
可解释人工智能 (XAI,全称为 Explainable AI) 是一组流程和方法,允许人类用户理解和信任机器学习算法创建的结果和输出。
条件计算 (Conditional computation) 是一种减少总计算量的技术,它只会在需要时才会进行计算。
统计分类 (Statistical Classification) 是一种监督学习方法,用于将新观测数据分到已知类别中的某一个类别。
变分自编码器 (Variational Autoencoder,VAE) 是由 Diederik P. Kingma 和 Max Welling 提出的一种人工神经网络结构,属于概率图模式和变分贝叶斯方法。
掩码语言建模 (MLM) 是一种在自然语言处理 (NLP) 任务中广泛使用的深度学习技术,特别是在 Transformer 模型(如 BERT 、 GPT-2 和 RoBERTa)的训练中。
知识工程 (Knowledge Engineering) 是人工智能(AI)的一个分支,它开发规则并应用于数据,以模仿对特定主题具有专业知识的人的思维过程。
Inception Score (IS) 是一种客观性能指标,用于评估由生成对抗网络 (GAN) 生成的生成图像或合成图像的质量。
模糊逻辑 (Fuzzy Logic) 是一种变量处理方法,允许通过同一变量处理多个可能的真值。模糊逻辑试图通过开放的、不精确的数据谱和启发式方法来解决问题,从而获得一系列准确的结论。
Fréchet 初始距离 FID 是一种性能指标, FID 分数越低代表生成器生成的图像质量越高并且与真实图像相似。 FID 基于图像的特征向量。
DALL-E 是 OpenAI 开发的根据文本描述提示生成图像的新型人工智能程序。它可以将语言和视觉处理结合起来,这种创新方法为创意领域、交流、教育等领域开辟了新的可能性。 DALL-E 于 2021 年 1 月推出,是 […]
LoRA(低等级自适应)是一种突破性的高效微调技术,它可以利用这些先进模型的力量来完成定制任务和数据集,而不会造成资源紧张或成本过高。
CBR 的工作原理是检索过去的类似案例,并根据当前情况进行调整,以做出决策或解决问题。
对抗性机器学习 (Adversarial Machine Learning) 是一种机器学习方法,旨在通过提供欺骗性输入来欺骗机器学习模型。
认知搜索 (Cognitive Search) 代表了新一代的企业搜索,它使用人工智能 (AI) 技术来改进用户的搜索查询并从多个不同的数据集中提取相关信息。
代码质量 (Code Quality) 描述了对一段软件代码的有效性、可靠性和可维护性的总体评估。代码质量的主要品质包括可读性、清晰度、可靠性、安全性和模块化等。 这些品质使代码易于理解、更改、操作和调试。
云容器是一种用于在云环境中部署、运行和管理应用程序的技术。它们提供了一种轻量级、可移植的方式,将应用程序及其依赖项封装在一个独立的运行环境中。
模型量化可以减少深度神经网络模型的内存占用和计算要求。权重量化是一种常见的量化技术,它涉及将神经网络的权重和激活从高精度浮点数转换为低精度格式,例如 16 位或 8 位整数。
triplet loss 是深度学习的一种损失函数,指的是最小化锚点和具有相同身份的正样本之间的距离,最小化锚点和具有不同身份的负样本之间的距离。
大型语言模型源运维 (LLMOps) 是用于生产环境中大型语言模型的操作管理的实践、技术和工具。 LLMOps 专门用于使用工具和方法来管理和自动化 LLM 的生命周期,从微调到维护。