属性の条件付き独立性の仮定属性の条件付き独立性の仮定
ナイーブ ベイズ分類器は、「属性の条件付き独立性の仮定」を採用しています。つまり、既知のカテゴリについては、すべての属性が互いに独立していると想定されます。
改良された単純ベイズ:
- トレーニングセットに一度も出現したことのない属性値によって他の属性によって運ばれる情報が「消去」されるのを防ぐために、確率値を推定する際には通常「平滑化」が実行され、「ラプラス補正」が一般的に使用されます。
- 属性の条件付き独立性の仮定をある程度緩和します。
- 有向非巡回グラフは属性間の依存関係を特徴付けるために使用され、条件付き確率テーブルは属性の同時確率分布を記述するために使用されます。
単純ベイズ分類器は拡張性が高いため、学習問題の変数 (特徴/予測子) において線形である多数のパラメーターが必要です。最尤トレーニングは、他の多くの種類の分類器で使用される時間のかかる反復近似を必要とせずに、線形時間で閉形式の式を評価することによって達成できます。
統計およびコンピューター サイエンスの文献では、単純ベイズ モデルは、単純ベイズや独立ベイズなど、さまざまな名前で知られています。これらの名前はすべて、分類器の決定ルールにおけるベイズの定理の使用を指しますが、ナイーブ ベイズは (必然的に) ベイズ手法を使用しません。「ナイーブ ベイズはベイズ分類器と呼ばれることもありますが、このずさんな使用法が真の意味を持つようになった」と述べています。ベイズ主義者はそれを愚か者のためのベイズモデルと呼びます。