归纳逻辑程序设计 Inductive Logic Programming

归纳逻辑程序设计(ILP)是一种符号规则学习方法,它在一阶规则学习中引入了函数和逻辑表达式嵌套,并以一阶逻辑为表达语言。 ILP 让机器学习系统具备更为强大的表达能力,同时它可看作是用机器学习的应用,主要用于解决基于背景知识的逻辑程序归纳,相关规则可被 PROLOG 等逻辑程序设…

归纳偏好 Inductive bias

归纳偏置可以看做是机器学习中的假设集合,它被用于机器学习中目标函数的必要假设,其中最典型的例子是奥卡姆剃刀。 归纳偏置基于数学逻辑,但在实际应用中,学习器的归纳偏置可能只是一个很粗糙的描述,甚至更为简单,相比之下,理论值过于严谨而无法被用于实际应用中。 归纳偏置的种类 目前常见的…

核方法 Kernel method

核方法是一类模式识别的算法,其目的是找出并学习一组数据中的相互的关系。 核方法成立基于以下假设:「在低维空间中不能线性分割的点集,通过转化为高维空间中的点集后,可能变为线性可分」。 核方法的基本认知:原始数据中的模式可以在某一维度的空间中被简单表达,其中「简单表达」是指线性关系,…

广义线性模型 Generalized linear model

广义线性模型是一种应用灵活的线性回归模型,其允许因变量的偏差分布有除了正态分布之外的分布形式。 定义 广义线性模型是简单最小二乘回归的扩展,假设每个资料的观测值 $latex {Y}$ 来自某个指数族分布,那么该分布的平均数 $latex {\mu}$ 可由该点独立的 $late…

高斯混合模型 Gaussian Mixture Model

高斯混合模型 GMM 基于高斯概率密度函数,它能够平滑的近似任意形状的密度分布,由于 GMM 具有多种模型,其划分精细的特点使得它可被用于复杂对象建模。 假设有一批观察数据 $latex {X\text{ }=\text{ }{ \{ {x\mathop{{}}\nolimits…

高斯核函数 Gaussian kernel function

高斯核函数是一种常用的核函数,它可以将有限维数据映射到高维空间,高斯核函数定义如下: $latex {k{ \left( {x,x\text{'}} \right) }\text{ }=\text{ }e\mathop{{}}\nolimits^{{-\frac{{{ \left…

混合计算 Hybrid computing

混合计算是一种整合计算,其包含传统的硬计算和新兴的软计算,该计算方式可以获取各自所长以克服局限性。 硬计算的主要特征: 易于建立问题的规范数学模型;建立的数学模型易于求解,且能达到较高的精确度;具有较好的稳定性。 软计算的主要特征: 难于建立问题的规范数学模型;难于获得问题较高精…

合页损失函数 Hinge loss function

合页损失函数的形状像一个合页,这也是其名称的由来,这种损失函数主要存在于支持向量机,其不仅要求分类正确,而且确信度足够高时损失才是 0,即合页损失函数对学习有更高的要求。 合页损失函数的公式为 L ( y ( w * x + b )) = [ 1 - y ( w * x + b …

归纳学习 Inductive learning

归纳学习是机器学习的一种方法,其通常被用于符号学习,主要通过给定关于某个概念的一系列已知正例和反例,并从中归纳出一个概念描述。 归纳学习可以获得新的概念,创立新的规则,发现新的理论,其一般操作是泛化和特化,其中泛化指扩展一个假设的语义信息,使其能够包含更多的正例以用于更多的情况;…

归纳 Induction

归纳法是一种推理过程,由一系列具体的事实概括出一般原理,其中数学的归纳方法是指从多个事物概括出一般性概念、原则或结论的思维方法。 归纳可分为完全归纳法和不完全归纳法: 完全归纳法:包含该类对象的全体,从而对该类对象作出一般性结论的方法;不完全归纳法:通过观察和研究发现某类事物中的…

个体学习器 Individual learner

个体学习器是一个相对概念,它是集成学习中集成之前的学习器。 根据个体学习器的生成方式,集成学习的方法可分为以下两类: 存在强依赖关系,必须串行生成的序列化方法,代表是 Boosting;不存在强依赖关系,可同时生成的并行化方法,代表是 Bagging 和「随机森林」Random …

关联分析 Association analysis

关联分析是在交易数据、关系数据或其他信息载体中,查找存在于项目或对象集合之间的频繁模式、关联、相关性或因果结构。 关联分析方法 Apriori 算法 Apriori 算法是挖掘产生布尔关联规则所需频繁项集的基本算法,它使用一种称作逐层搜索的迭代方法,k 项集用于探索 k+1 项集…

核范数 Nuclear Norm

核范数是矩阵奇异值的和,用于约束矩阵的低秩,对于稀疏性质的数据而言,其矩阵是低秩且会包含大量冗余信息,这些信息可被用于恢复数据和提取特征。 核范数定义 矩阵 X 的核范数定义式为: $latex {{ \left\Vert {X} \right\Vert }\mathop{{}}…

规则引擎 Rule Engine

规则引擎是一种嵌入在应用程序中的组件,其基于推理引擎发展,可实现将业务决策从应用程序代码中分离,并使用预定义的语义模块编写业务决策,可接收数据输入,解释业务规则,并根据业务规则作出相应的决策。 规则引擎的功能 实现将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务…