온라인 다중 대상 회귀 트리와 쌓인 리프 모델

현재 기계 학습에서의 주요 과제 중 하나는 데이터 스트림에서 점점 더 빠른 속도로 유입되는 데이터를 처리하는 방법입니다. 고속 데이터 처리와 개념 변화(concept drift)에 대응하기 위해 새로운 예측 학습 전략이 필요합니다. 이러한 새로운 학습 전략이 필요한 데이터 스트림 마이닝 작업 중 하나가 다중 대상 회귀(multi-target regression)입니다. 이는 많은 실제 문제에 적용될 수 있기 때문입니다. 배치 다중 대상 회귀에 대해서는 신뢰성 있고 효과적인 학습 전략들이 제안되었지만, 데이터 스트림에서의 다중 대상 온라인 학습을 위한 전략은 거의 제안되지 않았습니다. 또한 대부분의 기존 해결책들은 예측 시 대상 간 상관 관계(inter-target correlations)를 고려하지 않습니다. 본 연구에서는 데이터 스트림에서의 다중 대상 회귀를 위한 새로운 온라인 학습 전략을 제안합니다. 제안된 전략은 예측 시 대상 간 의존성을 탐색하기 위해 기존의 온라인 결정 트리 학습 알고리즘을 확장합니다. 이를 위해 제안된 전략, 즉 스택드 싱글-타겟 호프딩 트리(Stacked Single-target Hoeffding Tree, SST-HT)는 대상 간 의존성을 추가 정보원으로 사용하여 예측 정확도를 향상시킵니다. 광범위한 실험 설계를 통해 우리는 SST-HT를 온라인 다중 대상 회귀를 위한 최신 결정 트리 기반 알고리즘들과 비교 평가하였습니다. 실험 결과에 따르면, SST-HT는 약간의 처리 시간과 메모리 요구량 증가를 동반하면서도 우수한 예측 정확도를 보였습니다.