Command Palette
Search for a command to run...
百科
我们编汇了数百条相关词条,帮助您理解「人工智能」
Search for a command to run...
我们编汇了数百条相关词条,帮助您理解「人工智能」
容错学习问题(Learning With Errors,简称 LWE),是一个在密码学和理论计算机科学中非常重要的问题,由 Oded Regev 在 2005 年提出。 LWE 问题可以描述为:给定一个线性方程组,其中每 […]
在数学中,低秩近似是一个最小化问题,其中成本函数测量给定矩阵(数据)与近似矩阵(优化变量)之间的拟合度,但近似矩阵的秩必须降低。
知识提炼是一种机器学习技术,旨在将大型预训练模型(「教师模型」)的学习成果转移到较小的「学生模型」。
YOLOv10 实现了在显著降低计算开销的同时达到最先进的性能
基础设施即服务 (IaaS) 是一种云计算服务,它以按需付费的方式提供必要的计算、存储和网络资源。
NAS 指连接到网络并为计算机系统提供文件访问服务的存储设备。
数据湖不同于数据仓库或孤岛,其利用搭载对象存储的扁平架构来维护文件的元数据。
《通用数据保护条例》(GDPR) 是世界上最严格的隐私和安全法。
超融合基础架构(Hyper Converged Infrastructure,简称 HCI)是将服务器和存储组合成一个分布式基础设施平台,通过智能软件创建灵活的构建块,取代由单独服务器、存储网络和存储阵列组成的传统基础设 […]
百亿亿次计算是指能够计算至少” 每秒 10 18 个 IEEE 754 双精度(64 位)运算(乘法和/或加法)(exa FLOPS)” 的计算系统,它是超级计算机性能的衡量标准。 百亿亿级计算是计算 […]
超网络 (HyperNetworks) 是一种神经网络结构,其与传统的神经网络相比,在模型参数化方面有一些不同之处。 Google Brain 于 2016 年发表的论文「HyperNetworks」表示,在 Hyper […]
预测编码 (Predictive Coding,PC) 是认知科学中的一种理论框架,它认为人脑通过对视觉世界的时空预测来处理认知。
扩散概率模模型展示了扩散概率模型与 PC 理论之间的联系。
DQ-LoRe 框架利用「双重查询 (DQ) 和低秩近似重排 (LoRe)」自动选择上下文学习示例。
对比学习是一种通过使用相互对比样本的原理来学习数据类之间常见的属性以及将数据类与另一个数据类区分开的属性来增强视觉任务性能的技术。
通过解决传统 LSTM 的局限性并结合指数门控、矩阵存储器和可并行架构等新颖组件,xLSTM 为 LLM 开辟了新的可能性。
点云是空间中点的数据集,可以表示三维形状或对象,通常由三维扫描仪获取。
指代图像分割 (Referring Image Segmentation,简称 RIS,又叫指代分割) 旨在对自然语言表达所指代的目标对象进行分割。然而,以前的方法依赖于一个强有力的假设,即一个句子必须描述图像中的一个目 […]
多重草案模型(英语:Multiple drafts model),是一种基于认知主义的物理主义意识理论,由丹尼尔•丹尼特提出。该理论以讯息处理的角度来看待心灵 。丹尼特在 1991 年出版的《意识的解释》(Conscio […]
KAN: Kolmogorov-Arnold Networks 论文提出了一种有前景的多层感知器 (MLP) 的替代方案,称为 Kolmogorov-Arnold Networks (KAN) 。 KAN 名字的由来,是 […]
Kolmogorov-Arnold 表示定理使得对复杂的动力系统进行分析变得更加简单
行动模型学习包含人工智能领域内的复杂过程,其中模型的开发本质上是为了预测代理在环境中的动作的影响。
真阳性率 (True Positive Rate,简称 TPR) 是统计学、机器学习和医学诊断中用于评估二元分类模型性能的衡量标准。它表示被模型正确识别或分类为阳性的实际阳性病例的比例。 TPR 也称为灵敏度、召回率或命 […]
故障词元 (Glitch Token) 是指在大语言模型中,本应协助模型流畅运行的词元导致了异常输出。华中科技大学、南洋理工大学等高校联合组成的研究团队在其于 2024 年发表的一项研究「Glitch Tokens i […]