9 天前

自动支持向量数据描述

{Reza Sadeghi, Javad Hamidzadeh}
摘要

事件检测机制在医疗辅助系统、火灾抑制系统等众多领域具有广泛应用。这类系统通常需要在信息有限的情况下,仍能提供准确的响应。支持向量数据描述(Support Vector Data Description, SVDD)是实现此类检测任务的合适工具之一,尤其适用于处理信息不足的情况。因此,学术界已开展了大量研究以改进SVDD的性能。然而,现有方法在稀疏数据集上普遍存在数据特征表达能力弱的问题,且其调参机制设计不合理,导致在数据稀缺场景下事件检测系统的分类准确率显著下降。针对上述问题,本文提出一种自动支持向量数据描述方法(Automatic Support Vector Data Description, ASVDD)。该方法结合了源于模糊粗糙集理论的“验证度”(validation degree)概念,用于有效挖掘数据内在特征;同时,采用混沌蝙蝠算法(chaotic bat algorithm)自动优化模型的调参过程,以赋予各超参数更优的取值。为验证ASVDD的性能,我们在UCI机器学习数据集仓库中的多个数据集上进行了系统实验。实验结果表明,所提方法在分类准确率与AUC(受试者工作特征曲线下面积)指标上均优于当前主流先进方法。为进一步验证所提方法与现有领先方法在分类精度上的差异具有统计学意义,本文还引入了Wilcoxon符号秩检验(Wilcoxon statistical test),结果支持了该方法在性能上的显著优势。