错误率是指在预测中,预测错误所占的比例,计算公式一般是:1 - 准确度(%) 训练完成的模型,一般可以被用于测定某一模型在数据集中的错误率,其中有三个数很重要: Bayes Optimal Error:理想的不可测的极限值,在图像识别上可用人类错误率近似替代;Train Erro…
范围索引: ABC
超限学习机 Extreme Learning Machine
超限学习机是机器学习领域的一种神经网络模型,它可以被用于求解单隐层前馈神经网络。 不同于传统的前馈神经网络(如 BP 神经网络)需要人为设置大量的训练参数,超限学习算法只需要设定网络结构,无需设置其他参数,因此具有简单易用的特点。因为输入层到隐藏层的权值是一次随机确定的,因此算法…
博弈论 Game theory
博弈论又称对策论、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。主要研究激励结构间的相互作用,其考虑游戏中个体的预测行为和实际行为,并研究相关优化策略。 博弈行为是指具有竞争或对抗性质的行为,在这类行为中,参加斗争或竞争的各方均有不同的目标或利益,为了达到目标,…
层次聚类 Hierarchical clustering
层次聚类是一类算法的总成,即通过从下往上不断合并或者从上往下不断分裂以形成嵌套的簇,这种层次的类通过「树状图」来表示,而 Agglomerative Clustering 算法便是其中之一。 层次聚类试图在不同的「层次」上对样本数据进行划分,并一层一层地进行聚类,在聚类树中,不同…
边缘化 Marginalization
边缘化是基于变量发现另一变量的方法,它通过对变量的可能值求和以判定另一个变量的边缘贡献,这个定义相对抽象,下面便使用相关案例进行描述。 假设需要了解天气对幸福指数的影响程度,便可以用 P(幸福|天气)来表示,即给定天气类型的情况下,一个人的幸福指数大概是什么水准。 边缘化告诉我们…
边缘分布 Marginal Distribution
边缘分布指在概率论和统计学的多维随机变量中,只包含部分变量的概率分布。 定义 假设有一个和两个变量相关的概率分布: $latex P(x, y) $ 关于其中一个特定变量的边缘分布则为给定其他变量的条件概率分布:$latex P(x)=\sum_{y} P(x, y)=\sum_…
重赋权法 Re-weighting
重赋权法是赋权法的一种,是指在训练过程的每一轮中,可根据样本分布为每个训练样本重新赋予权重。 参考来源: 【1】 http://www.helsinki.fi/~rummukai/lectures/montecarlo_oulu/lectures/mc_notes4.pdf
参考模型 Reference model
参考模型是指被用于作为基准和对比的模型,在结构化信息标准促进组织的定义中,它被用于理解某些环境中实体之间的重要关系,以及用于开发支持该环境的一般标准或规范框架。 概念 摘要:参考模型被用于提供有关某种环境的信息,以及描述这种环境下可能发生的实体类型或种类,而不是特定环境下实际发生…
变分推断 Variational inference
变分推断是一种在概率图模型中进行近似推断的方法,相比基于采样的随机化方法,它是一种确定性逼近方法。 定义 变分推断的思想的要点可以概括如下: 使用已知的简单分布来逼近需推断的复杂分布;限制近似分布的类型;得到一种局部最优、但具有确定解的近似后验分布。 原始目标是根据已有数据推断需…
标记化 Tokenization
标记化又称词汇分析,它是将字符转换成标记(具有相关标识含义的字符串)的过程。其中执行词法分析的程序也被称为词法分析器、标记器或扫描仪,但扫描仪只是词法分析器第一阶段的术语,词法分析器通常与解析器组合运用,其中解析器主要被用于分析编程语言、网页等语法。 标记化是划分并对输入字符串的…
词义消歧 Word sense disambiguation
词义消歧( WSD ) 即在词语层次上的语义消歧。它是一个自然语言处理和本体论的开放问题。 歧义与消歧是自然语言理解中最核心的问题,在词义、句义、篇章含义层次都会出现语言根据上下文语义不同的现象,消歧即指根据上下文确定对象语义的过程。 语义消歧/词义消歧 是自然语言处理任务的一个…
词嵌入 Word embedding
词嵌入是自然语言处理中的语言模型和表征学习技术的统称。概念上而言,它是指将单词从高维空间嵌入到低维连续向量空间中,每个单词或词组会被映射为实数域上的向量。 目前词嵌入的方法包括人工神经网络、词语同线矩阵降维、概率模型和单词所在上下文显性表示等,在底层输入中,词嵌入表示词组的方法可…
半监督支持向量机 semi-Supervised Support Vector Machine
半监督支持向量机「S3VM」是支持向量机在半监督学习上的推广,相较于需要找出最大间隔划分超平面的支持向量机,S3VM 只考虑未标注样本的信息,并试图找到能将两类有标记样本分开,且穿过数据低密度区域的划分超平面。 S3VM 特点 S3VM 基于聚类假设,试图通过探索未标记数据来规范…
表示定理 Representer Theorem
表示定理是统计学习中的一则定理,用于表明再生核 Hilbert 空间上正则化风险函数的最小值,可表示为在核函数的线性组合。 实际应用举例 在 L2 正则化问题上: 表示定理是指任意一个 L2 正则化的问题,其最佳 w* 都可以用 βn 与 Zn 线性组合得到。 表示定理的意义 简…
残差网络 Residual Network
残差网络「ResNet」是在简单网络的基础上,通过插入快捷链接将其转化为对应的残差版本,其不直接拟合目标,而是拟合残差。 ResNet 的基本思想是引入「shortcut connection」概念,使得其更容易被优化,包含一个「shortcut connection」的多层网络…