11일 전

MAGNET: 주의 기반 그래프 신경망을 이용한 다중 레이블 텍스트 분류

{Muru Selvakumar and Malaikannan Sankarasubbu, Ankit Pal}
초록

다중 레이블 텍스트 분류(Multi-Label Text Classification, MLTC)에서는 하나의 샘플이 두 개 이상의 클래스에 속할 수 있다. 대부분의 MLTC 작업에서 레이블 간에 의존성 또는 상관관계가 존재하는 것으로 관찰된다. 기존의 방법들은 레이블 간의 관계를 무시하는 경향이 있다. 본 논문에서는 레이블 간의 주목적 의존성 구조를 포착하기 위해 그래프 주목망(Graph Attention Network, GAT) 기반 모델을 제안한다. 제안된 그래프 주목망은 특성 행렬과 상관관계 행렬을 활용하여 레이블 간의 핵심 의존성을 포착하고 탐색하며, 해당 작업을 위한 분류기를 생성한다. 생성된 분류기는 텍스트 특성 추출 네트워크(BiLSTM)를 통해 얻은 문장 특성 벡터에 적용되어 엔드 투 엔드 학습을 가능하게 한다. 주목망은 각 레이블에 대해 이웃 노드에 대해 서로 다른 가중치를 부여할 수 있도록 하여, 레이블 간의 의존성을 암묵적으로 학습할 수 있게 한다. 제안된 모델의 성능은 다섯 개의 실제 세계 MLTC 데이터셋을 대상으로 검증되었으며, 기존 최고 성능 모델들과 비교하여 유사하거나 더 우수한 성능을 달성하였다.

MAGNET: 주의 기반 그래프 신경망을 이용한 다중 레이블 텍스트 분류 | 최신 연구 논문 | HyperAI초신경