HyperAI초신경

회귀

반품이는 주로 수치적 연속 확률 변수의 예측과 모델링에 사용되는 지도 학습 알고리즘입니다. 이는 입력과 출력 간의 관계를 정의하는데, 입력은 기존 지식이고 출력은 예측된 값입니다.

회귀 분석의 목적은 가장 적합한 선을 얻는 것입니다.

가정과 내용

  • 데이터 분석에서는 일반적으로 데이터에 대한 몇 가지 가정을 하는 것이 필요합니다.
  • 분산의 동질성
  • 선형 관계
  • 누적 효과
  • 변수 측정 오류 없음
  • 변수는 다변수 정규 분포를 따릅니다.
  • 관찰 독립성
  • 모델 완성
  • 오차항은 독립적이며 (0, 1) 정규 분포를 따릅니다.

회귀분석의 주요 내용

  1. 일련의 데이터에서 출발하여 특정 변수들 간의 정량적 관계를 파악합니다. 즉, 수학적 모델을 수립하고 그 안의 알려지지 않은 매개변수를 추정합니다. 매개변수를 추정하는 일반적인 방법은 최소제곱법입니다.
  2. 이러한 관계의 신뢰성이 시험되었습니다.
  3. 여러 독립변수가 종속변수에 공동으로 영향을 미치는 관계에서, 어떤 독립변수가 유의미한 영향을 미치고 어떤 독립변수가 유의미하지 않은 영향을 미치는지 판별하고, 유의미한 영향을 미치는 독립변수들을 모형에 추가하고, 유의미하지 않은 영향을 미치는 변수들을 제거해야 합니다. 일반적으로 단계적 회귀, 전방 회귀, 후방 회귀와 같은 방법이 사용됩니다.
  4. 필요한 관계를 사용하여 생산 과정을 예측하거나 제어합니다. 회귀 분석의 적용 범위는 매우 광범위하며, 통계 소프트웨어 패키지를 이용하면 다양한 회귀 분석 방법을 매우 편리하게 계산할 수 있습니다.

회귀분석 연구의 주요 이슈

  • Y와 X 사이의 양적 관계식을 결정하는데, 이를 회귀 방정식이라고 합니다.
  • 얻어진 회귀 방정식의 신뢰성을 테스트합니다.
  • 독립변수 X가 종속변수 Y에 영향을 미치는지 확인합니다.
  • 얻어진 회귀 방정식은 예측 및 제어에 사용됩니다.

회귀 분석의 단계

  • 변수 결정: 예측의 구체적인 목표를 명확히 하면 종속 변수도 결정됩니다.
  • 예측모형 수립: 독립변수와 종속변수의 과거 통계자료를 바탕으로 계산을 하고, 이를 바탕으로 회귀분석 방정식, 즉 회귀분석 예측모형을 수립합니다.
  • 상관관계 분석 수행: 회귀 분석은 인과 관계가 있는 영향 요인과 예측 객체에 대한 수학적, 통계적 분석입니다. 확립된 회귀 방정식은 독립변수와 종속변수 사이에 실제로 특정한 관계가 있을 때에만 의미가 있습니다. 왜냐하면
  • 예측 오차 계산: 회귀 예측 모델을 실제 예측에 사용할 수 있는지 여부는 회귀 예측 모델의 테스트와 예측 오차 계산에 따라 달라집니다.
  • 예측값 결정: 회귀 예측 모델을 사용하여 예측값을 계산하고, 예측값에 대한 포괄적인 분석을 수행하여 최종 예측값을 결정합니다.

회귀 분석 방법

  • 선형 회귀(정규화): 선형 회귀는 회귀 작업에 가장 일반적으로 사용되는 알고리즘 중 하나입니다. 이 알고리즘은 형태가 간단하며 데이터 세트에 맞추기 위해 초평면을 사용할 것으로 예상됩니다.
  • 회귀 트리(앙상블 방법): 회귀 트리는 데이터 집합을 여러 분기로 반복적으로 분할하여 계층적 학습을 달성하며, 분할 기준은 각 분할의 정보 이득을 최대화하는 것입니다.

회귀 및 기타 문제

  • 입력 변수와 출력 변수가 모두 연속 변수인 예측 문제는 회귀 문제입니다.
  • 유한한 수의 이산 출력 변수가 있는 예측 문제는 분류 문제가 됩니다.
  • 입력 변수와 출력 변수가 모두 가변 시퀀스인 경우의 예측 문제는 레이블 지정 문제가 됩니다.
관련 단어: 분류, 라벨링