계층 불균형
클래스 불균형은 두 클래스의 레이블이 빈도 면에서 큰 차이를 보이는 이진 분류 문제입니다.
예를 들어, 질병 데이터 세트에서 0.0001개 샘플은 양의 클래스 레이블을 가지고 있고 0.9999개 샘플은 음의 클래스 레이블을 가지고 있는데, 이는 분류 불균형 문제입니다. 하지만 축구 경기 예측에서는 0.51개의 샘플이 한 팀이 이긴다는 라벨을 가지고 있고 0.49개의 샘플이 다른 팀이 이긴다는 라벨을 가지고 있는데, 이는 분류 불균형 문제가 아닙니다.