8 个月前

卷积神经网络

多任务学习

计算机视觉

Zhao-Min Chen Xiu-Shen Wei Peng Wang Yanwen Guo

摘要

多标签图像识别的任务是预测图像中出现的一组对象标签。由于对象通常在图像中共同出现，因此建模标签之间的依赖关系对于提高识别性能至关重要。为了捕捉和探索这些重要的依赖关系，我们提出了一种基于图卷积网络（Graph Convolutional Network, GCN）的多标签分类模型。该模型在对象标签上构建了一个有向图，其中每个节点（标签）由该标签的词嵌入表示，而GCN则被训练用于将此标签图映射为一组相互依赖的对象分类器。这些分类器应用于由另一个子网络提取的图像描述符，从而使整个网络可以端到端地进行训练。此外，我们提出了一种新颖的重加权方案，以创建有效的标签相关矩阵来指导GCN中节点间的信息传播。在两个多标签图像识别数据集上的实验表明，我们的方法明显优于现有的其他最先进方法。此外，可视化分析显示，通过我们的模型学习到的分类器保持了有意义的语义拓扑结构。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

卷积神经网络

多任务学习

计算机视觉

Zhao-Min Chen Xiu-Shen Wei Peng Wang Yanwen Guo

摘要

多标签图像识别的任务是预测图像中出现的一组对象标签。由于对象通常在图像中共同出现，因此建模标签之间的依赖关系对于提高识别性能至关重要。为了捕捉和探索这些重要的依赖关系，我们提出了一种基于图卷积网络（Graph Convolutional Network, GCN）的多标签分类模型。该模型在对象标签上构建了一个有向图，其中每个节点（标签）由该标签的词嵌入表示，而GCN则被训练用于将此标签图映射为一组相互依赖的对象分类器。这些分类器应用于由另一个子网络提取的图像描述符，从而使整个网络可以端到端地进行训练。此外，我们提出了一种新颖的重加权方案，以创建有效的标签相关矩阵来指导GCN中节点间的信息传播。在两个多标签图像识别数据集上的实验表明，我们的方法明显优于现有的其他最先进方法。此外，可视化分析显示，通过我们的模型学习到的分类器保持了有意义的语义拓扑结构。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供