다중 인스턴스 학습
Multiple Instance Learning (MIL)은 약간의 감독을 받는 학습 알고리즘으로, 훈련 데이터가 여러 인스턴스 $X=\{x_1, x_2, \ldots, x_M\}$를 포함하는 가방(bag) 형태로 구성됩니다. 각 가방은 단일 레이블 $Y \in \{0, 1\}$을 가지고 있으며, 알고리즘은 각 인스턴스가 자신의 레이블 $y_1, y_2, \ldots, y_M$을 가지고 있다는 가정을 하지만, 이 레이블들은 훈련 과정에서 알려지지 않습니다. 표준 Multiple Instance Learning 가정은 다음과 같습니다: 만약 가방 내 모든 인스턴스가 음성(negative)이라면, 가방은 음성으로 분류됩니다; 만약 가방 내 최소 하나의 인스턴스가 양성(positive)이라면, 가방은 양성으로 분류됩니다. 이 알고리즘은 복잡한 데이터 구조를 처리하는 데 큰 장점을 가지고 있어, 특히 의료 이미지 분류와 같은 분야에서 유용하게 적용될 수 있습니다.