그래디언트 부스팅
그래디언트 부스팅은 여러 개의 약한 예측 모델(일반적으로 의사결정 트리)을 결합하여 강력한 예측 모델을 구축하는 앙상블 학습 알고리즘입니다. 이 방법의 핵심은 손실 함수를 최적화하여 모델의 복잡성을 점진적으로 증가시키고, 이를 통해 예측 정확도를 향상시키는 것입니다. 그래디언트 부스팅은 회귀 문제와 분류 문제를 모두 해결하는 데 사용할 수 있습니다.
이 개념은 1999년 제롬 H. 프리드먼이 처음 제안했으며, 그는 다양한 손실 함수를 처리하기 위해 부스팅 알고리즘에 경사 하강법이라는 아이디어를 도입했습니다. 그의 논문에서탐욕 함수 근사: 그래디언트 부스팅 머신"그래디언트 부스팅 알고리즘의 원리와 응용 프로그램을 자세히 설명합니다.
그래디언트 부스팅은 제곱 오차, 절대 오차, 교차 엔트로피 등 미분 가능한 손실 함수를 사용할 수 있으므로 지수 손실 함수를 기반으로 하는 다른 알고리즘보다 더 유연하고 일반적입니다. 의사결정 트리, 신경망, 지원 벡터 머신 등 모든 유형의 기본 학습기를 사용할 수 있어 알고리즘의 다양성과 성능이 향상됩니다. 그래디언트 부스팅은 학습률, 반복 횟수, 트리 깊이 등의 매개변수를 조정함으로써 모델의 복잡성과 과적합 정도를 제어하여 알고리즘의 안정성과 제어성을 향상시킬 수 있습니다.
그래디언트 부스팅 기술은 제조, 의료 진단, 제품 설계, 결함 진단 및 품질 검사에 널리 사용됩니다.