HyperAI초신경

속성 조건부 독립성 가정

나이브 베이즈 분류기는 "속성 조건부 독립성 가정"을 채택합니다. 즉, 알려진 범주에 대해 모든 속성은 서로 독립적이라고 가정합니다.

개선된 나이브 베이즈:

  1. 다른 속성이 지닌 정보가 학습 세트에 나타난 적이 없는 속성 값에 의해 "지워지는" 것을 방지하기 위해 확률 값을 추정할 때 일반적으로 "평활화"를 수행하며, 종종 "라플라스 보정"이 사용됩니다.
  2. 속성 조건부 독립성 가정은 어느 정도 완화됩니다.
  3. 속성 간의 종속 관계는 유향 비순환 그래프를 사용하여 특징지어지며, 속성의 결합 확률 분포는 조건부 확률 표를 사용하여 기술됩니다.

나이브 베이즈 분류기는 확장성이 매우 뛰어나 학습 문제의 변수(특징/예측 변수) 수에 선형적인 여러 매개변수가 필요합니다. 최대 우도 학습은 다른 많은 유형의 분류기에서 사용하는 시간 소모적인 반복적 근사를 필요로 하지 않고 선형 시간 내에 폐쇄형 표현식을 평가하여 수행할 수 있습니다.

통계학 및 컴퓨터 과학 문헌에서 나이브 베이즈 모델은 단순 베이즈와 독립 베이즈를 포함한 다양한 이름으로 알려져 있습니다. 이러한 모든 이름은 분류기의 결정 규칙에서 베이즈 정리를 사용하는 것을 나타내지만, 나이브 베이즈는 (반드시) 베이지안 방법을 사용하지는 않습니다. 러셀과 노르빅은 "'나이브 베이즈'는 때때로 베이지안 분류기라고 불리는데, 이는 엉성한 용법이라 진정한 베이지안들은 이를 덤 베이즈 모델이라고 부른다"고 지적합니다.