2ヶ月前

ジェネリックな畳み込みネットワークと再帰ネットワークのシーケンスモデリングへの実証的評価

Shaojie Bai; J. Zico Kolter; Vladlen Koltun
ジェネリックな畳み込みネットワークと再帰ネットワークのシーケンスモデリングへの実証的評価
要約

多くの深層学習の実践者にとって、シーケンスモデリングは再帰型ネットワークと同義である。しかし、最近の研究結果は、音声合成や機械翻訳などのタスクにおいて、畳み込み型アーキテクチャが再帰型ネットワークを上回ることが示唆している。新しいシーケンスモデリングのタスクやデータセットが与えられた場合、どのアーキテクチャを使用すべきか?私たちは、一般的な畳み込み型と再帰型のアー�キテクチャについて、シーケンスモデリングにおける系統的な評価を行った。これらのモデルは、再帰型ネットワークの性能を評価するために一般的に使用される多様な標準的なタスクで評価された。私たちの結果は、単純な畳み込み型アーキテクチャがLSTMなどの典型的な再帰型ネットワークよりも多様なタスクやデータセットで優れた性能を示し、より長い有効メモリを持つことを示している。したがって、シーケンスモデリングと再帰型ネットワークとの間の一般的な関連性を見直す必要があり、畳み込み型ネットワークをシーケンスモデリングタスクの自然な出発点として捉えるべきであるという結論に至る。関連する研究を支援するために、コードを http://github.com/locuslab/TCN で公開している。

ジェネリックな畳み込みネットワークと再帰ネットワークのシーケンスモデリングへの実証的評価 | 最新論文 | HyperAI超神経