17일 전

빠르고 적응형 예측 구간을 위한 회귀 트리

Luben M. C. Cabezas, Mateus P. Otto, Rafael Izbicki, Rafael B. Stern
빠르고 적응형 예측 구간을 위한 회귀 트리
초록

예측 모델은 오류를 범할 수 있다. 따라서 예측과 관련된 불확실성을 정량화할 필요가 있다. 통계적 유효성을 갖는 예측 구간을 점 예측 주변에 생성하는 데 있어, 공식적 추론(Conformal inference)이 강력한 도구로 부상했지만, 회귀 문제에 그대로 적용할 경우 적응형이 아닌 비적응형 구간을 생성한다. 이러한 한계를 극복하기 위해, 분위수 회귀 모델이나 조건부 밀도 추정기 등을 활용하는 새로운 공식적 점수들이 제안되고 있다. 비록 이러한 점수들은 예측 밴드를 생성하는 데 유용하지만, 임의의 예측 모델 주변의 불확실성을 측정하는 원초적인 목표와는 거리가 있다. 본 논문은 지역적 커버리지 보장 조건 하에서 회귀 문제에 대한 예측 구간을 보정하기 위한, 모델 독립적인 새로운 방법론 가족을 제시한다. 제안하는 접근법은 조건부 커버리지를 근사하는 가장 거친 특성 공간 분할을 추구하는 데 기반한다. 이 분할은 공식적 점수를 기반으로 회귀 트리와 랜덤 포레스트를 학습함으로써 생성된다. 본 방법은 다양한 공식적 점수와 예측 설정에 적용 가능하며, 시뮬레이션 및 실제 데이터셋에서 기존 기준 대비 뛰어난 확장성과 성능을 보여준다. 본 연구는 표준 scikit-learn 인터페이스를 사용하여 제안된 방법을 구현한 Python 패키지 clover를 제공한다.