HyperAIHyperAI

Command Palette

Search for a command to run...

تصنيف النصوص

تصنيف النص هو مهمة أساسية في معالجة اللغات الطبيعية، تهدف إلى تصنيف بيانات النص إلى فئات محددة مسبقًا. تحقق هذه المهمة تنظيم واسترجاع المعلومات بكفاءة من خلال تحليل محتوى النص وتحديد خصائصه مثل الموضوع، والمشاعر، أو النية. في السنوات الأخيرة، ساهمت نماذج التعلم العميق مثل XLNet وRoBERTa في تحسين أداء تصنيف النص بشكل كبير، مما دفع التطورات التقنية. يتم استخدام مجموعات البيانات المرجعية مثل GLUE وAGNews على نطاق واسع لتقييم فعالية هذه النماذج.

MTEB
ST5-XXL
AG News
R8
RoBERTaGCN
DBpedia
XLNet
TREC-6
Automatic Label Error Correction
20NEWS
RoBERTaGCN
UK Key Stage Readability
Yahoo! Answers
BERT-ITPT-FiT
Ohsumed
SGCN
MR
R52
GraphStar
NewsDiscourse
Yelp-5
HAHNN (CNN)
Yelp-2
SVICTOR (type)
OneStopEnglish (Readability Assessment)
RoBERTa-RF-T1 hybrid
DODF Data
ULMFiT (pre-trained vocab, no gradual unfreezing)
WeeBit (Readability Assessment)
BART-RF-T1 hybrid
Lot-insts
Character-BERT+RS
MVICTOR (type)
ThreatGram 101 - Extreme Telegram Data
GPT-2
HateXplain
arXiv-10
Protoformer
RCV1
NLP-Cap
Amazon-2
Sogou News
BERT-ITPT-FiT
IMDb Movie Reviews
Logistic Regression
Overruling
Custom Legal-BERT
Terms of Service
Amazon-5
BLURB
BioLinkBERT (large)
Twitter
GLUE SST2
Searchsnippets
An Amharic News Text classification Dataset
Naive Bayes using Tf-idf features
Social media attributions of YouTube comments
MuLD (Character Type)
SST-2
TREC-50
This is not a Dataset
AffCon 2020 Emotion Detection
STOPS-2
ERNIE 2.0
TREC-10
BERT
Twitter Sentiment Analysis
Logistic Regression
STOPS-41
TRAC2-English. Task2.
SILICONE Benchmark
TRAC2-Benghali. Task 2.
BERT
RusAge: Corpus for Age-Based Text Classification
LSVC + linguistic features + publishing attributes
Twitter-US
WNUT-2020 Task 2
NutCracker
Adverse Drug Events (ADE) Corpus
20 Newsgroups
RoBERTaGCN
GLUE MRPC
NICE-45
GLUE RTE
NICE-2
BANKING77
Arxiv HEP-TH citation graph
BigBird
Patents
BigBird
FMC-MWO2KG
Flair
Hyperpartisan News Detection
BigBird
Facebook Media
Hyperpartisan
ade_corpus_v2Ade_corpus_v2_classification
GLUE
financial_phrasebank
GLUE STSB
Unknown
emotion
clinc_oos
catalonia_independence
book-text-classifier
GLUE COLA
GLUE QQP
hate_speech18
tecla
IMDb
KLUE
SST2
MNIST
New_York_Times_Topics
SemEval 2014 Task 4 (Restaurants)
NSFW-Safe-Dataset
amazon_reviews_multi