12일 전
셸 이론: 현실의 통계적 모델
{Yasuyuki Matsushita, Hongdong Li, Ngai-Man Cheung, Changhao Ren, Siying Liu, Wen-Yan Lin}

초록
기계 학습의 기본 가정은 고려 중인 데이터가 클래스로 구분 가능해야 한다는 것이다. 직관적으로 타당해 보이지만, 구분 가능성 조건을 수학적으로 정의하는 것은 매우 어려운 문제로 밝혀졌다. 우리는 이 문제의 근본 원인이 기존 통계 기법과 일반적으로 접하는 데이터 간의 불일치에 있다고 믿는다. 물체의 표현은 일반적으로 고차원이지만, 통계 기법은 고차원을 특수한 경우 또는 열화된 상태로 간주하는 경향이 있다. 이 문제를 해결하기 위해 우리는 고차원 환경에서의 기계 학습을 위한 전용 통계적 프레임워크를 개발하였다. 본 프레임워크는 물체 간의 관계가 자연스럽게 계층 구조를 이룬다는 관찰에서 출발하며, 이에 따라 물체를 고차원적이고 계층적인 생성 과정의 예시로 모델링한다. 본 논문에서 함께 개발한 거리 기반 통계 기법을 활용하여, 이러한 생성 과정에서 각 계층의 각 과정에 해당하는 예시들은 거의 항상 다른 모든 예시들을 배제하는 특징적인 껍질(shell)에 포획됨을 보였다. 그 결과로 도출된 것이 ‘쉘 이론(Shell Theory)’이며, 이는 구분 가능성 조건(특징적인 껍질)이 가정된 생성 과정에서 공식적으로 도출되는 통계적 기계 학습 프레임워크이다.