HyperAIHyperAI

Command Palette

Search for a command to run...

DIANet:密集隐式注意力网络

Zhongzhan Huang Senwei Liang Mingfu Liang Haizhao Yang

摘要

注意力网络在各种视觉问题中成功提升了性能。以往的研究重点在于设计新的注意力模块,并将其单独插入到网络中。本文提出了一种新颖且简单的框架,该框架在整个不同网络层之间共享一个注意力模块,以促进层次信息的融合,这一参数共享模块被称为密集隐式注意(Dense-and-Implicit-Attention, DIA)单元。许多类型的模块都可以用于DIA单元中。由于长短期记忆(Long Short-Term Memory, LSTM)具有捕捉长距离依赖的能力,我们特别关注当DIA单元为改进的LSTM(称为DIA-LSTM)的情况。在基准数据集上的实验表明,DIA-LSTM单元能够强调层次特征之间的相互关系,并显著提高图像分类的准确性。我们进一步通过实验证明,DIA-LSTM在去除整个残差网络中的跳过连接或批归一化时,具有强大的正则化能力,能够稳定深度网络的训练过程。代码已发布在https://github.com/gbup-group/DIANet


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供