다중 레이블 텍스트 분류
다중 레이블 텍스트 분류는 머신 러닝에서 하나의 인스턴스가 여러 개의 레이블을 가질 수 있도록 하는 분류 문제 유형입니다. 이 작업의 목표는 주어진 텍스트 데이터가 속할 수 있는 모든 관련 카테고리를 예측하는 것입니다. 다중 클래스 분류와 달리, 다중 레이블 분류는 인스턴스에 할당될 수 있는 레이블의 수를 제한하지 않아, 복잡하고 다차원적인 데이터를 처리하는 데 더 유연하고 실용적입니다. 다중 레이블 텍스트 분류는 감성 분석, 뉴스 분류, 의료 진단 등 다양한 분야에서 널리 사용되며, 텍스트의 여러 속성과 의미를 더 정확하게 포착하고 표현할 수 있게 합니다.
CC3M-TagMask
Reuters-21578
CB-NTR
AAPD
MAGNET
Freecode
TagBERT
BVICTOR
XGBoost
EUR-Lex
bert-base
MIMIC-III
HLAN
MVICTOR (theme)
XGBoost
SVICTOR (theme)
MIMIC-III-50
HLAN
Amazon-12K
LAHA
Dataset of Propaganda Techniques of the State-Sponsored Information Operation of the People's Republic of China
Bert
Kan-Shan Cup
LAHA
LF-AmzonTitles-131K
ECLARE
LF-AmazonTitles-131K
RCV1
HiddeN
RCV1-v2
Slashdot
MAGNET
USPTO-3M
BERT
Wiki-30K