예측 분석
예측 분석은 데이터를 사용하여 미래의 결과를 예측하는 프로세스입니다.이 프로세스에서는 데이터 분석, 머신 러닝, 인공 지능 및 통계 모델을 사용하여 미래의 행동을 예측할 수 있는 패턴을 찾습니다. 조직에서는 과거 및 현재 데이터를 활용하여 몇 초, 며칠 또는 몇 년 후의 추세와 행동을 매우 정확하게 예측할 수 있습니다.
예측 분석의 작동 방식
데이터 과학자는 예측 모델을 사용하여 선택된 데이터 세트의 다양한 요소 간의 상관 관계를 파악합니다. 데이터가 수집되면 통계 모델을 개발하고, 훈련하고, 수정하여 예측을 생성합니다.
예측 분석 프레임워크를 구축하기 위한 워크플로는 5가지 기본 단계로 구성됩니다.
- 문제 정의: 예측은 좋은 주제와 요구 사항부터 시작됩니다. 예를 들어, 예측 분석 모델이 사기를 감지할 수 있을까요? 휴일 쇼핑 시즌의 최적 재고 수준을 결정할 수 있나요? 심각한 기상 조건으로 인해 발생할 수 있는 홍수 수위를 결정할 수 있나요? 명확한 질문에 대한 답변은 사용해야 할 예측 분석 접근 방식을 결정하는 데 도움이 됩니다.
- 데이터 수집 및 구성: 조직은 수십 년 동안 축적된 데이터를 보유하고 있을 수도 있고, 고객 상호 작용을 통해 생성된 엄청난 양의 데이터가 끊임없이 흐를 수도 있습니다. 예측 분석 모델을 개발하기 전에 데이터 흐름을 식별한 다음 데이터 세트를 저장소에 정리해야 합니다.
- 데이터 전처리: 원시 데이터 자체는 명목상으로만 유용합니다. 예측 분석 모델을 위한 데이터를 준비하려면 입력 또는 측정 오류로 인해 발생할 수 있는 비정상적인 값, 누락된 데이터 포인트 또는 극단적인 이상치를 제거하기 위해 데이터를 정리해야 합니다.
- 예측 모델 개발: 데이터 과학자는 해결해야 할 문제와 데이터 세트의 특성에 따라 다양한 도구와 기술을 사용하여 예측 모델을 개발할 수 있습니다. 머신 러닝, 회귀 모델, 의사결정 트리는 가장 일반적인 예측 모델 유형입니다.
- 결과 확인 및 배포: 모델의 정확도를 확인하고 그에 따라 조정합니다. 만족스러운 결과를 얻으면 앱, 웹사이트 또는 데이터 대시보드를 통해 이해관계자에게 공개됩니다.
예측 분석 방법
일반적으로 예측 모델에는 분류 모델과 회귀 모델이라는 두 가지 유형이 있습니다. 분류 모델은 고객이나 잠재적 결과와 같은 데이터 객체를 범주에 할당하려고 시도합니다. 예를 들어, 소매업체가 다양한 유형의 고객에 대한 많은 데이터를 보유하고 있다면, 어떤 유형의 고객이 마케팅 이메일을 받을 의향이 있는지 예측해 볼 수 있습니다. 회귀 모델은 고객이 회사와의 관계를 유지하는 동안 얼마나 많은 수익을 가져올 것인지와 같은 연속형 데이터를 예측하려고 시도합니다.
예측 분석을 수행하는 데 일반적으로 사용되는 세 가지 주요 분석 접근 방식은 다음과 같습니다.
- 회귀 분석: 회귀 분석은 변수 간의 관계를 추정하는 데 사용되는 통계적 분석 방법입니다. 회귀 분석은 대규모 데이터 세트에서 패턴을 식별하여 입력 간의 상관관계를 파악하는 데 사용할 수 있습니다. 이 방법은 알려진 분포를 따르는 연속형 데이터에 가장 적합합니다. 회귀 분석은 하나 이상의 독립 변수가 다른 독립 변수에 어떤 영향을 미치는지(예: 가격 인상이 제품 판매에 어떤 영향을 미치는지) 확인하는 데 자주 사용됩니다.
- 의사결정 트리: 의사결정 트리는 다양한 변수를 기준으로 데이터를 여러 범주로 분류할 수 있는 분류 모델입니다. 이러한 접근 방식은 개인의 결정을 이해하는 데 가장 적합합니다. 이 모델은 나무처럼 생겼는데, 각 가지는 가능한 선택을 나타내고, 가지의 잎은 결정의 결과를 나타냅니다. 의사결정 트리는 일반적으로 이해하기 쉽고 데이터 세트에 여러 개의 변수가 누락된 경우 좋은 성능을 보입니다.
- 신경망: 신경망은 매우 복잡한 관계를 모델링할 때 매우 유용한 예측 분석 방법인 머신 러닝 방법입니다. 본질적으로 이들은 강력한 패턴 인식 엔진입니다. 신경망은 데이터 집합에서 비선형 관계를 식별하는 데 가장 적합하며, 특히 데이터를 분석하는 데 사용할 수 있는 수학 공식이 없는 경우에 유용합니다. 신경망은 의사결정 트리와 회귀 모델의 결과를 검증하는 데 사용할 수 있습니다.
예측 분석의 용도 및 예
예측 분석은 은행, 소매, 공익사업, 공공 부문, 의료, 제조 등 거의 모든 기업이나 산업에서 운영을 간소화하고 수익을 늘리고 위험을 줄이는 데 활용할 수 있습니다. 때로는 사람들은 빅데이터에 머신 러닝을 활용하는 증강 분석을 사용하기도 합니다. 다른 사용 사례는 다음과 같습니다.
- 사기 감지:예측 분석은 회사 네트워크 내의 모든 동작을 실시간으로 조사하여 사기 및 기타 취약점으로 이어질 수 있는 이상 징후를 식별합니다.
- 전환 및 구매 예측:기업은 온라인 광고로 방문자를 리타겟팅하는 등의 조치를 취할 수 있으며, 데이터를 사용하여 어떤 방문자가 전환 가능성이 높고 구매 의도가 더 높은지 예측할 수 있습니다.
- 위험 감소:신용 평가, 보험 청구, 채무 추심은 모두 예측 분석을 사용하여 미래의 채무 불이행 가능성을 평가하고 판단할 수 있습니다.
- 운영 개선 사항:회사에서는 예측 분석 모델을 사용하여 재고를 예측하고, 리소스를 관리하고, 운영 효율성을 개선합니다.
- 고객 세분화: 마케터는 고객 기반을 특정 그룹으로 세분화하여 예측 분석을 통해 미래 지향적인 결정을 내리고 고유한 대상 고객 세그먼트에 맞게 콘텐츠를 맞춤화할 수 있습니다.
- 유지 관리 예측:조직에서는 데이터를 사용하여 장비에 정기적인 유지 관리가 필요한 시기를 예측하고 문제나 고장을 방지하기 위해 적절한 시기에 유지 관리 일정을 잡을 수 있습니다.
참고문헌
【1】https://cloud.google.com/learn/what-is-predictive-analytics?hl=zh-cn