17日前

複素変換器:複素数値シーケンスをモデル化するためのフレームワーク

Muqiao Yang, Martin Q. Ma, Dongyu Li, Yao-Hung Hubert Tsai, Ruslan Salakhutdinov
複素変換器:複素数値シーケンスをモデル化するためのフレームワーク
要約

近年、深層学習はさまざまな分野において注目を集めているが、主要な深層学習モデルの多くは複素数をほとんど使用していない。一方で、フーリエ変換を適用した音声、信号および音響データは自然に複素数値となる。また、複素数ネットワークがより豊かな表現能力を有する可能性が既に示唆されている。本論文では、系列モデリングの基盤としてトランスフォーマー・モデルを採用する「複素トランスフォーマー(Complex Transformer)」を提案する。さらに、複素数入力を処理可能なアテンション機構およびエンコーダ・デコーダネットワークを構築した。本モデルはMusicNetデータセットおよびイン・フェーズ・クアドラチャ(IQ)信号データセットにおいて、現在の最先端(SOTA)性能を達成した。