9일 전

HSCNN: 극도로 불균형한 다중 레이블 텍스트 분류를 위한 하이브리드-시아메스 컨볼루션 신경망

{Yanming Ye, Fumiyo Fukumoto, Jiyi Li, Wenshuo Yang}
HSCNN: 극도로 불균형한 다중 레이블 텍스트 분류를 위한 하이브리드-시아메스 컨볼루션 신경망
초록

다중 레이블 텍스트 분류에서 데이터 불균형 문제는 핵심적인 과제이다. 기존의 일부 연구들은 단순한 크로스 엔트로피 손실 대신 불균형 손실 목적함수를 제안함으로써 이 문제를 다루고 있으나, 극도로 불균형한 데이터 상황에서는 여전히 성능 한계가 존재한다. 본 연구에서는 헤드 카테고리에는 일반적인 네트워크 구조를, 테일 카테고리에는 소수 샘플 기법을 적응시키는 하이브리드 솔루션을 제안한다. 제안하는 하이브리드-시엠네이즈 컨볼루션 신경망(HSCNN)은 다음과 같은 기술적 특징을 갖는다: 단일 네트워크와 시엠네이즈 네트워크를 기반으로 한 다중 작업(Multi-task) 아키텍처; 시엠네이즈 구조 내에서 카테고리별 유사도를 반영한 설계; HSCNN 학습을 위한 특수한 샘플링 방법. 두 개의 벤치마크 데이터셋과 세 가지 손실 목적함수를 활용한 실험 결과, 본 방법은 다양한 손실 목적함수를 사용하는 단일 네트워크의 테일 카테고리 또는 전체 카테고리에 대한 성능을 향상시킬 수 있음을 입증하였다.

HSCNN: 극도로 불균형한 다중 레이블 텍스트 분류를 위한 하이브리드-시아메스 컨볼루션 신경망 | 최신 연구 논문 | HyperAI초신경