
要約
時系列分類分野において、シェイプレット(shapelets)とは特定のクラスに対して識別的な小さな時系列を指す。これまでの研究で、入力時系列と異なる識別的シェイプレットとの距離を入力として用いる分類器が、多数のデータセットにおいて最先端の性能を達成できることを示している。さらに、これらのシェイプレットは容易に可視化可能であり、解釈可能性を持つという特徴を有しているため、縦断的データが一般的な医療分野をはじめとする重要な分野において特に魅力的である。本研究では、進化的計算(evolutionary computation)に基づく新しいシェイプレット発見のパラダイムを提案する。本手法の利点は以下の通りである:(i)勾配を必要としないため、局所最適解からの脱出が容易になり、適切な候補の探索がしやすくなるとともに、微分不可能な目的関数にも対応可能である;(ii)ブルートフォース探索を要しないため、計算複雑度が数桁以上大幅に削減される;(iii)シェイプレットの総数および各シェイプレットの長さが、シェイプレット自体とともに進化的に最適化されるため、事前にこれらのパラメータを設定する必要がなくなる;(iv)個々のシェイプレットではなく、全体のセットを一度に評価するため、最終的に得られるシェイプレット集合はより小さく、類似度の低いものが得られ、その結果、類似した予測性能を示すことが可能となる;(v)発見されたシェイプレットは、入力時系列の部分列である必要がない。本研究では、上述の利点を実証する実験結果を提示する。