HyperAI超神経

ランダムフォレストアルゴリズム

ランダムフォレストこれは、複数のデシジョン ツリーを含む多機能アルゴリズムであり、デシジョン ツリーをトレーニングするために置換サンプリングで構成されるサンプル セットを使用します。トレーニング中に、デシジョン ツリーの各ノードはランダムにサンプリングされたいくつかの特徴のみを使用します。

属性に基づいて新しいオブジェクトを分類する場合、ランダム フォレスト内の各ツリーは最初に独自の分類の選択肢を与え、それに対して「投票」します。回帰の場合、フォレストの出力結果が最も多くの票を獲得したものになります。問題がある場合、フォレストの出力はデシジョン ツリーの出力の平均になります。

ランダム フォレスト アルゴリズムでは、「ランダム」が核であり、「フォレスト」は単なる組み合わせ手法にすぎません。フォレスト内の各ツリーを構築する際には、ツリー間の独立性を確保するために、通常 2 ~ 3 層のランダム性が使用されます。 。

ランダムフォレストの機能

  • 利点: 非常に高い精度、オーバーフィットしにくい、優れた耐ノイズ能力、特徴を選択せずに高次元データを処理できる、離散データと連続データを処理できる、データセットを正規化する必要がない、トレーニング速度が速い、変数の重要度ランキングを取得でき、簡単に並列化できます。
  • 短所: パラメーターは複雑で、トレーニングには多くのスペースと時間が必要で、モデルの一部の領域は説明できません。

ランダムフォレストアプリケーション

  • 回帰および分類タスクを実行します。
  • 欠損値、外れ値、およびデータ探索におけるその他の重要な手順を処理するため。
  • 複数の非効率なモデルを 1 つの効率的なモデルに統合するために使用されます。
親単語: バギングアルゴリズム
子単語: 決定木

参考文献

【1】https://blog.csdn.net/qq547276542/article/details/78304454

【2】https://blog.csdn.net/lishuandao/article/details/52555103

【3】https://en.wikipedia.org/wiki/Random_forest

【4】http://dataunion.org/23602.html