11일 전
계층적 다중 레이블 분류를 위한 쌍방향 하이퍼볼릭 레이블 임베딩 학습
Soumya Chatterjee, Ayush Maheshwari, Ganesh Ramakrishnan, Saketha Nath Jagaralpudi

초록
다중 레이블 분류 문제를 고려한다. 이때 레이블들은 계층 구조를 갖는다. 그러나 기존의 계층적 다중 레이블 분류 연구들과 달리, 본 연구에서는 레이블 계층 구조가 사전에 알려져 있다고 가정하지 않는다. 최근 하이퍼볼릭 임베딩이 계층적 관계를 효과적으로 표현하는 데 성공한 점에 착안하여, 분류기 파라미터와 레이블 임베딩을 동시에 학습하는 방식을 제안한다. 이러한 공동 학습은 두 가지 측면에서 이점을 제공할 것으로 기대된다. 첫째, 레이블 간의 계층 구조가 존재한다는 사전 지식을 활용함으로써 분류기가 보다 우수한 일반화 성능을 발휘할 수 있다. 둘째, 레이블 동시 발생 정보 외에도, 입력 데이터 포인트의 매니폴드 구조를 고려한 레이블 임베딩은 레이블 계층 구조를 더욱 정확하게 반영할 수 있다. 본 연구는 이러한 공동 학습을 위한 새로운 수식화를 제안하고, 실증적으로 그 효과를 평가한다. 실험 결과, 레이블 동시 발생 정보를 기반으로 사전 훈련된 하이퍼볼릭 임베딩을 사용하는 기준 모델에 비해 공동 학습 방식이 우수한 성능을 보였다. 또한 제안한 분류기는 표준 벤치마크에서 최신 기준(SOTA) 수준의 일반화 성능을 달성하였다. 더불어 공동 학습을 통해 얻은 하이퍼볼릭 임베딩의 성능을 평가하여, 다른 대안보다 계층 구조를 더 정확히 표현함을 입증하였다.