出力コードのエラー修正
誤り訂正出力符号化方式 ECOC は、複数クラスの問題を複数の 2 クラス問題に変換でき、誤り訂正出力コード自体に誤り訂正機能があるため、教師あり学習アルゴリズムの予測精度を向上させることができます。
出力カテゴリをコーディングすると、複数カテゴリの問題を 2 つのカテゴリに分割できます。つまり、各カテゴリは長さ n のバイナリ ビット文字列に対応し、合計 m 個のコードワードを形成してバイナリ関数を記述します。学習後、入力サンプルに対する各二分化器の結果が出力ベクトルを形成し、決定ルールによって入力サンプルのカテゴリが決定されます。
符号化理論では、ハミング距離はブロック コードの誤り訂正能力を決定するために使用され、また、出力コードの誤り訂正能力を決定するためにも使用されます。
誤り訂正出力コード行列の行数は教師あり分類問題のカテゴリ数mに一致し、列数は符号長nに一致します。利用可能な誤り訂正出力コードは以下の特性を持ちます。 :
- 特定のエラー訂正機能を備えています。
- コード行列には、すべて 0 の列やすべて 1 の列はありません。
- コード行列には同一の列や相補的な列はありません。
現在一般的に使用されているエンコード方式には次のものがあります。
- 列挙型エンコーディング
- ランダムな山登り
- BCH符号化方式
- 連続符号化方式
- 検索エンコーディング