多分类 Multi-class classification

多分类有时也称多元分类,是指在分类任务中不止两种类别的归类。

现有的多类分类技术可以分为(i)转换为二进制(ii)从二进制扩展和(iii)分层分类。

常见策略

1)one-vs.-all 策略需要为每一个类建立一个唯一的分类器,属于此类的所有样例均为正例,其余的全部为负例。这一策略需要基础分类器去产生一个实值置信度以供决策,而不仅仅是一个类标签;单独产生的类标签可能会导致归类的不明确,以致于一个样例会被预测属于多个类。

2) one-vs-one(OvO)策略中,对于一个 K 类多元问题,训练 K (K − 1) / 2 个二元分类器;每一个从初始训练集中收到一对类样例,并且必须学习去区分这两个类。在预测时间内,会有一个投票:所有 K (K − 1) / 2 个解释器被应用于一个未知样例,并且那个得到最多”+1″ 预测的类会成为组合分类器的预测结果。