機能の選択機能の選択
機能の選択これは機能サブセットを選択するプロセスであり、通常はモデルを共同で構築するために使用されます。その利点には主に次のようなものがあります。
- モデルを単純化します。
- トレーニング時間を短縮します。
- 汎用性を向上させ、過剰適合を軽減します
特徴選択アルゴリズムは、検索技術と評価メトリックの組み合わせとして見ることができ、前者は候補となる新しい特徴サブセットを提供し、後者はさまざまな特徴サブセットをスコアリングします。最も簡単なのは、各サブセットをテストして、エラー率が最も低いサブセットを見つけることです。このアルゴリズムには網羅的な検索スペースが必要です。すべての特徴セットの計算を完了することは難しいため、特徴のより小さなサブセットしかカバーできず、アルゴリズムに大きな影響を与えます。
さまざまな評価指標により、特徴選択アルゴリズムは、パッケージ化、フィルタリング、埋め込みの 3 つのカテゴリに分類できます。