
초록
이 논문은 표형 데이터 처리를 위한 딥러닝의 효과성에 대해 분석하고자 한다. 일반적으로 의사결정 트리와 그 앙상블이 이 분야에서 선도적인 방법으로 여겨지며, 딥 네트워크는 컴퓨터 비전 등에 한정되어야 한다는 인식이 있다. 그러나 딥 네트워크는 기울기 기반의 계층적 표현을 구축하는 프레임워크이며, 이 핵심 특성은 이미지 매트릭스나 오디오 스펙트로그램뿐만 아니라 일반적인 구조화된(표형) 데이터 처리에도 최적의 성능을 제공할 수 있어야 한다. 이 문제는 야후드 시프트 챌린지(Yandex Shifts challenge)의 날씨 예측 트랙(즉, Yandex Shifts 날씨 과제)을 통해 분석된다. 이 과제는 전통적인 표형 데이터 회귀 문제의 변형이며, 동시에 머신러닝에서 중요한 주제인 일반화 및 불확실성 문제와도 관련이 있다. 본 논문은 네 가지 아이디어의 결합을 기반으로 한 엔드 투 엔드 알고리즘을 제안한다. 이는 1) 자기정규화 신경망의 딥 앙상블, 2) 가우시안 목표 오차 분포의 파라미터 추정으로서의 회귀, 3) 계층적 다중작업 학습, 그리고 4) 간단한 데이터 전처리이다. 제안된 알고리즘의 세 가지 변형이 각각 야후드 시프트 날씨 챌린지의 상위 3위 랭킹을 차지하였다. 본 논문은 이러한 성공이 딥러닝 알고리즘의 근본적인 특성에 기인했다고 보고, 이를 입증하려고 시도한다.