15日前

混合信号における条件付きチェーンマッピングを用いたシーケンスからマルチシーケンスへの学習

Jing Shi, Xuankai Chang, Pengcheng Guo, Shinji Watanabe, Yusuke Fujita, Jiaming Xu, Bo Xu, Lei Xie
混合信号における条件付きチェーンマッピングを用いたシーケンスからマルチシーケンスへの学習
要約

神経ネットワークに基づくシーケンス・トゥ・シーケンスモデルは、単一の入力シーケンスを単一の出力シーケンスに写像することができるタスクにおいて、広く確立された手法である。本研究では、混合シーケンスから複数の順序付き出力源を抽出するなど、1対多のシーケンス変換問題に注目する。標準的なシーケンス・トゥ・シーケンスモデルを拡張し、複数の出力シーケンス間の関連性を確率的連鎖則(probabilistic chain rule)を用いて明示的にモデル化する条件付き多シーケンスモデルを提案する。この拡張モデルにより、入力シーケンスおよびすでに推定された文脈的な出力シーケンスを活用しながら、出力シーケンスを順次条件付きで推論することが可能となる。さらに、変換の終了を判断するシンプルかつ効率的な停止基準を備えており、出力シーケンスの数が可変である場合にも対応できる。音声データを主な検証対象としている。これは、音波の重ね合わせの原理(superposition principle)に起因し、観測される音声データがしばしば複数の音源の重ね合わせで構成されるためである。音声分離やマルチスピーク音声認識を含む複数のタスクにおける実験結果から、本研究で提案する条件付き多シーケンスモデルが、従来の非条件付きモデルに対して一貫した性能向上を示した。

混合信号における条件付きチェーンマッピングを用いたシーケンスからマルチシーケンスへの学習 | 最新論文 | HyperAI超神経