2 个月前

MRL:基于注意力机制和卷积的学习混合方法

Mohta, Shlok ; Suganuma, Hisahiro ; Tanaka, Yoshiki
MRL:基于注意力机制和卷积的学习混合方法
摘要

本文介绍了一种新的神经架构模块,名为混合区域和局部特征(Mixing Regionally and Locally, MRL),旨在高效且有效地混合输入特征。我们将输入特征的混合任务分为区域尺度和局部尺度两个层面。为了实现高效的混合,我们利用自注意力机制提供的全领域感受野进行区域尺度的特征混合,同时使用限制在局部尺度上的卷积核进行局部尺度的特征混合。具体而言,我们的方法首先将定义区域内与局部特征相关的区域特征进行混合,然后通过加入区域特征来增强局部尺度的特征混合。实验表明,这种自注意力机制和卷积的结合带来了更好的容量、泛化能力(正确的归纳偏置)和效率。在相似的网络设置下,MRL在分类、目标检测和分割任务中表现出色或与同类方法持平。此外,我们还展示了基于MRL的网络架构在H&E组织学数据集上达到了最先进的性能。我们在Kumar、CoNSep和CPM-17数据集上分别获得了0.843、0.855和0.892的DICE分数,同时突出了MRL框架通过引入如分组卷积等层以提高特定数据集泛化能力的灵活性。

MRL:基于注意力机制和卷积的学习混合方法 | 最新论文 | HyperAI超神经