11 天前

多任务课程框架用于开放集半监督学习

Qing Yu, Daiki Ikami, Go Irie, Kiyoharu Aizawa
多任务课程框架用于开放集半监督学习
摘要

半监督学习(Semi-Supervised Learning, SSL)旨在当仅有少量标注数据可用时,利用未标注数据来训练性能强大的模型。现有SSL方法通常假设标注数据与未标注数据中的样本属于相同的类别。然而,本文提出了一种更为复杂且新颖的场景——开放集半监督学习(Open-Set SSL),其中未标注数据中包含分布外(Out-of-Distribution, OOD)样本。不同于将分布外检测与半监督学习分别独立处理,本文提出一种多任务课程学习框架。首先,为检测未标注数据中的OOD样本,我们估计样本属于OOD的概率。为此,设计了一种联合优化框架,交替更新网络参数与OOD评分。同时,为提升对分布内(In-Distribution, ID)数据分类的性能,我们从未标注数据中筛选出OOD得分较低的样本(即更可能为ID样本),并将这些样本与已标注数据共同用于深度神经网络的训练,从而以半监督方式实现对ID样本的高效分类。通过一系列实验验证,所提方法在有效消除OOD样本干扰的同时,取得了当前最优的性能表现,显著提升了开放集半监督学习的实用性与鲁棒性。

多任务课程框架用于开放集半监督学习 | 最新论文 | HyperAI超神经