HyperAI超神経

開梱時の見積もり

外注見積りこれは、トレーニング セットには含まれないテスト データを使用して意思決定を行う方法です。

一括見積りの定義

訓練された各決定木 g に対するランダム フォレストのバギング プロセス t 、データセット D と次の関係があります。

アスタリスク部分、つまり選択されていないデータは、十分なデータがある場合に、いずれかのデータ セット (xn、yn) がアウトオブバッグ (OOB) データであると呼ばれます。バッグのデータは次のとおりです。

基本分類器はトレーニング サンプルのブートストラップ サンプリング セットに基づいて構築されているため、元のサンプル セットの約 63.2% のみが に表示されますが、データの残りの 36.8% はパッケージ外のデータとして使用され、基本分類子の検証セット。

アウトオブバッグ推定は、アンサンブル分類器の汎化誤差の不偏推定値であることが確認されています。ランダム フォレスト アルゴリズムにおけるデータ セット属性、分類器セットの強度、および分類器間の相関計算の重要性はすべて依存しています。バッグから出したデータ。

見積委託の目的

  • 基本学習器がデシジョン ツリーである場合、アウトオブバッグ サンプルを使用して枝刈りを支援したり、デシジョン ツリー内の各ノードの事後確率を推定してゼロ トレーニング サンプル ノードの処理を支援したりできます。
  • 基本学習器がニューラル ネットワークである場合、out-of-bag サンプルを使用して早期停止を支援し、過剰適合を減らすことができます。
親単語: ランダム フォレスト アルゴリズム