8 个月前

摘要

卷积操作仅限于局部，因此无法建模全局交互。然而，自注意力机制能够学习捕捉序列中的长距离依赖关系的表示。我们提出了一种结合卷积和自注意力机制的音频超分辨率网络架构。基于注意力的特征级线性调制（AFiLM）使用自注意力机制而不是递归神经网络来调制卷积模型的激活。大量实验表明，我们的模型在标准基准测试中优于现有方法。此外，该模型允许更多的并行化处理，从而显著加快训练速度。

源 PDF