17 天前
复杂Transformer:一种建模复数值序列的框架
Muqiao Yang, Martin Q. Ma, Dongyu Li, Yao-Hung Hubert Tsai, Ruslan Salakhutdinov

摘要
近年来,深度学习在多个领域受到广泛关注,但主流深度学习模型极少使用复数。然而,经过傅里叶变换后,语音、信号和音频数据天然具有复数值特性,已有研究表明,复数神经网络可能具备更丰富的表征能力。本文提出一种复数Transformer(Complex Transformer),以Transformer架构作为序列建模的骨干网络,并设计了适用于复数输入的注意力机制及编码器-解码器网络。该模型在MusicNet数据集和同相正交(In-phase Quadrature, IQ)信号数据集上均取得了当前最优的性能表现。