15日前

長期時系列予測のためのMixture-of-Linear-Experts

Ronghao Ni, Zinan Lin, Shuaiqi Wang, Giulia Fanti
長期時系列予測のためのMixture-of-Linear-Experts
要約

長期時系列予測(LTSF)は、過去の時系列値をもとに将来の値を予測することを目的としている。この問題における現在の最先端(SOTA)手法は、一部のケースで線形中心型モデルによって達成されており、その特徴は主に線形マッピング層を備えている点にある。しかしながら、その本質的な単純さのため、時系列パターンの周期的な変化に予測ルールを適応させる能力に欠ける。この課題に対処するため、本研究では線形中心型モデルに対する「エキスパートの混合(Mixture-of-Experts)」スタイルの拡張を提案し、Mixture-of-Linear-Experts(MoLE)を導入する。単一のモデルを学習するのではなく、MoLEは複数の線形中心型モデル(すなわちエキスパート)と、それらの出力を重み付け・混合するルーター(router)モデルを学習する。全体としてエンド・ツー・エンドで訓練される一方で、各エキスパートは特定の時系列パターンに特化して学習し、ルーターモデルはエキスパートを適応的に組み合わせる能力を学習する。実験の結果、MoLEはDLinear、RLinear、RMLPといった線形中心型モデルの予測誤差を、評価したデータセットおよび設定の78%以上で低減することが確認された。また、MoLEを導入することで、既存の線形中心型モデルはPatchTSTが報告する実験の68%においてSOTAのLTSF性能を達成できる一方で、従来の単一ヘッド型線形中心型モデルはそのようなケースがわずか25%にとどまることが明らかになった。

長期時系列予測のためのMixture-of-Linear-Experts | 最新論文 | HyperAI超神経