
초록
우리는 각 트리가 정규화 사전 확률 분포에 의해 제약을 받아 약한 학습자(weak learner)가 되도록 하는 베이지안 '트리의 합(sum-of-trees)' 모델을 개발하였습니다. 이 모델은 사후 확률 분포로부터 샘플을 생성하는 반복적인 베이지안 백피팅 MCMC 알고리즘을 통해 적합과 추론을 수행합니다. 효과적으로, BART는 차원에 적응하는 랜덤 기저 요소를 사용하는 비모수적 베이지안 회귀 접근법입니다. 앙상블 방법, 특히 부스팅 알고리즘에서 영감을 받은 BART는 통계적 모델로 정의되며, 이는 사전 확률 분포와 우도 함수로 구성됩니다. 이러한 접근법은 알려지지 않은 회귀 함수의 점 추정치와 구간 추정치뿐만 아니라 잠재적 예측 변수의 주변 효과에 대한 완전한 사후 추론을 가능하게 합니다. 예측 변수 포함 빈도를 추적함으로써, BART는 모델 없이 변수 선택에도 활용될 수 있습니다. BART의 다양한 기능은 42개의 다른 데이터 세트에서 경쟁 방법들과의 대결(bake-off), 시뮬레이션 실험 및 약물 발견 분류 문제를 통해 설명됩니다.