HyperAIHyperAI

Command Palette

Search for a command to run...

深度复数网络

Chiheb Trabelsi,∗♦♦ Olexa Bilaniuk,∗♦ Ying Zhang,†♦♦ Dmitriy Serdyuk,†♦ Sandeep Subramanian,†♦ João Felipe Santos,♦ Soroush Mehri,♥ Negar Rostamzadeh,♦ Yoshua Bengio♦¶ Christopher J Pal♦¶

摘要

目前,深度学习中的大多数构建模块、技术和架构都是基于实数值操作和表示的。然而,近期关于递归神经网络的研究以及早期的基础理论分析表明,复数可能具有更丰富的表示能力,并且有助于实现抗噪的记忆检索机制。尽管复数深度神经网络具有吸引人的特性,并有可能开启全新的神经网络架构,但由于缺乏设计此类模型所需的基本构建模块,它们一直被边缘化。在本研究中,我们提供了复数深度神经网络的关键原子组件,并将其应用于卷积前馈网络和卷积LSTM(长短期记忆)网络。具体而言,我们依赖于复数卷积,并提出了适用于复数神经网络的复数批量归一化算法、复数权重初始化策略,并在端到端训练方案中进行了实验验证。我们证明了这些复数模型在性能上可以与其实数值对应模型相媲美。我们在多个计算机视觉任务、使用MusicNet数据集的音乐转录任务以及使用TIMIT数据集的语音频谱预测任务上测试了深复数模型。实验结果表明,这些与音频相关的任务达到了当前最佳性能。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
深度复数网络 | 论文 | HyperAI超神经