HyperAIHyperAI

Command Palette

Search for a command to run...

텍스트 분류

텍스트 분류는 자연어 처리의 핵심 작업으로, 텍스트 데이터를 미리 정의된 범주로 분류하는 것을 목표로 합니다. 이 작업은 텍스트 내용을 분석하고 주제, 감정, 의도 등의 특성을 식별하여 정보를 효율적으로 조직하고 검색할 수 있게 합니다. 최근에는 XLNet과 RoBERTa와 같은 딥러닝 모델이 텍스트 분류의 성능을 크게 향상시켜 기술적 발전을 이끌고 있습니다. GLUE와 AGNews와 같은 벤치마크 데이터셋은 이러한 모델의 효과성을 평가하는 데 널리 사용되고 있습니다.

MTEB
ST5-XXL
AG News
R8
RoBERTaGCN
DBpedia
XLNet
TREC-6
Automatic Label Error Correction
20NEWS
RoBERTaGCN
UK Key Stage Readability
Yahoo! Answers
BERT-ITPT-FiT
Ohsumed
SGCN
MR
R52
GraphStar
NewsDiscourse
Yelp-5
HAHNN (CNN)
Yelp-2
SVICTOR (type)
OneStopEnglish (Readability Assessment)
RoBERTa-RF-T1 hybrid
DODF Data
ULMFiT (pre-trained vocab, no gradual unfreezing)
WeeBit (Readability Assessment)
BART-RF-T1 hybrid
Lot-insts
Character-BERT+RS
MVICTOR (type)
ThreatGram 101 - Extreme Telegram Data
GPT-2
HateXplain
arXiv-10
Protoformer
RCV1
NLP-Cap
Amazon-2
Sogou News
BERT-ITPT-FiT
IMDb Movie Reviews
Logistic Regression
Overruling
Custom Legal-BERT
Terms of Service
Amazon-5
BLURB
BioLinkBERT (large)
Twitter
GLUE SST2
Searchsnippets
An Amharic News Text classification Dataset
Naive Bayes using Tf-idf features
Social media attributions of YouTube comments
MuLD (Character Type)
SST-2
TREC-50
This is not a Dataset
AffCon 2020 Emotion Detection
STOPS-2
ERNIE 2.0
TREC-10
BERT
Twitter Sentiment Analysis
Logistic Regression
STOPS-41
TRAC2-English. Task2.
SILICONE Benchmark
TRAC2-Benghali. Task 2.
BERT
RusAge: Corpus for Age-Based Text Classification
LSVC + linguistic features + publishing attributes
Twitter-US
WNUT-2020 Task 2
NutCracker
Adverse Drug Events (ADE) Corpus
20 Newsgroups
RoBERTaGCN
GLUE MRPC
NICE-45
GLUE RTE
NICE-2
BANKING77
Arxiv HEP-TH citation graph
BigBird
Patents
BigBird
FMC-MWO2KG
Flair
Hyperpartisan News Detection
BigBird
Facebook Media
Hyperpartisan
ade_corpus_v2Ade_corpus_v2_classification
GLUE
financial_phrasebank
GLUE STSB
Unknown
emotion
clinc_oos
catalonia_independence
book-text-classifier
GLUE COLA
GLUE QQP
hate_speech18
tecla
IMDb
KLUE
SST2
MNIST
New_York_Times_Topics
SemEval 2014 Task 4 (Restaurants)
NSFW-Safe-Dataset
amazon_reviews_multi