6 个月前

卷积神经网络

计算机视觉

Junnan Li Richard Socher Steven C.H. Hoi

摘要

深度神经网络以标注数据需求量大著称。为降低深度网络学习过程中的标注成本，研究者们提出了诸多方法。其中两个主流方向分别是利用噪声标签进行学习，以及通过挖掘未标注数据实现半监督学习。本文提出了一种名为 DivideMix 的新框架，旨在通过融合半监督学习技术来应对噪声标签学习问题。具体而言，DivideMix 采用混合模型对每个样本的损失分布进行建模，动态地将训练数据划分为两部分：包含干净样本的有标签数据集，以及包含噪声样本的无标签数据集，并以半监督方式在有标签和无标签数据上联合训练模型。为避免确认偏差（confirmation bias），我们同时训练两个结构不同的网络，每个网络均使用另一网络所生成的数据划分结果。在半监督训练阶段，我们对 MixMatch 策略进行了改进，分别对有标签样本和无标签样本执行标签协同精炼（label co-refinement）与标签协同猜测（label co-guessing）。在多个基准数据集上的实验结果表明，该方法显著优于当前最先进的技术。相关代码已开源，地址为：https://github.com/LiJunnan1992/DivideMix。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Junnan Li Richard Socher Steven C.H. Hoi

摘要

深度神经网络以标注数据需求量大著称。为降低深度网络学习过程中的标注成本，研究者们提出了诸多方法。其中两个主流方向分别是利用噪声标签进行学习，以及通过挖掘未标注数据实现半监督学习。本文提出了一种名为 DivideMix 的新框架，旨在通过融合半监督学习技术来应对噪声标签学习问题。具体而言，DivideMix 采用混合模型对每个样本的损失分布进行建模，动态地将训练数据划分为两部分：包含干净样本的有标签数据集，以及包含噪声样本的无标签数据集，并以半监督方式在有标签和无标签数据上联合训练模型。为避免确认偏差（confirmation bias），我们同时训练两个结构不同的网络，每个网络均使用另一网络所生成的数据划分结果。在半监督训练阶段，我们对 MixMatch 策略进行了改进，分别对有标签样本和无标签样本执行标签协同精炼（label co-refinement）与标签协同猜测（label co-guessing）。在多个基准数据集上的实验结果表明，该方法显著优于当前最先进的技术。相关代码已开源，地址为：https://github.com/LiJunnan1992/DivideMix。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供