
초록
기존의 계층적 텍스트 분류(Hierarchical Text Classification, HTC) 방법들은 모델 학습을 위해 라벨 계층 구조를 포착하려고 시도하지만, 추론 과정에서는 각 라벨에 대한 지역적인 결정을 내리거나 완전히 계층 정보를 무시합니다. 이러한 학습과 추론 사이의 불일치 문제와 라벨 간 의존성을 원칙적으로 더 잘 모델링하기 위해, 우리는 HTC를 마르코프 결정 과정(Markov Decision Process)으로 정식화하고 딥 강화학습을 통해 라벨 할당 정책(Label Assignment Policy)을 학습하여 객체를 어디에 배치할지와 언제 할당 과정을 중단할지를 결정하는 방법을 제안합니다. 제안된 방법인 HiLAP는 학습 및 추론 시간 동안 일관된 방식으로 계층 구조를 탐색하며 상호 의존적인 결정을 내립니다. 일반적인 프레임워크로서 HiLAP는 엔드투엔드(end-to-end) 학습을 위해 다양한 신경망 인코더(neural encoders)를 기본 모델로 통합할 수 있습니다. 다섯 개의 공개 데이터셋과 네 개의 기본 모델에서 수행한 실험 결과, HiLAP는 평균적으로 플랫 분류기(flat classifiers)보다 Macro-F1에서 33.4% 향상되었으며, 최신 HTC 방법들보다 크게 우수한 성능을 보였습니다. 데이터와 코드는 https://github.com/morningmoni/HiLAP에서 확인할 수 있습니다.