HyperAI

메인 페이지

GPU

콘솔
문서
가격

Pulse

뉴스

리소스

논문
노트북
데이터 세트
위키

벤치마크

SOTA
LLM 모델
GPU 리더보드

커뮤니티

이벤트

유틸리티

정보 서비스 이용약관 개인정보 처리방침
한국어

Command Palette

Search for a command to run...

HyperAI
SOTA
텍스트 분류

텍스트 분류

텍스트 분류는 자연어 처리의 핵심 작업으로, 텍스트 데이터를 미리 정의된 범주로 분류하는 것을 목표로 합니다. 이 작업은 텍스트 내용을 분석하고 주제, 감정, 의도 등의 특성을 식별하여 정보를 효율적으로 조직하고 검색할 수 있게 합니다. 최근에는 XLNet과 RoBERTa와 같은 딥러닝 모델이 텍스트 분류의 성능을 크게 향상시켜 기술적 발전을 이끌고 있습니다. GLUE와 AGNews와 같은 벤치마크 데이터셋은 이러한 모델의 효과성을 평가하는 데 널리 사용되고 있습니다.

Automatic Label Error Correction

UK Key Stage Readability

OneStopEnglish (Readability Assessment)

RoBERTa-RF-T1 hybrid

ULMFiT (pre-trained vocab, no gradual unfreezing)

WeeBit (Readability Assessment)

BART-RF-T1 hybrid

Character-BERT+RS

ThreatGram 101 - Extreme Telegram Data

IMDb Movie Reviews

Logistic Regression

Custom Legal-BERT

Terms of Service

BioLinkBERT (large)

An Amharic News Text classification Dataset

Naive Bayes using Tf-idf features

Social media attributions of YouTube comments

MuLD (Character Type)

This is not a Dataset

AffCon 2020 Emotion Detection

Twitter Sentiment Analysis

Logistic Regression

TRAC2-English. Task2.

SILICONE Benchmark

TRAC2-Benghali. Task 2.

RusAge: Corpus for Age-Based Text Classification

LSVC + linguistic features + publishing attributes

WNUT-2020 Task 2

Adverse Drug Events (ADE) Corpus

Arxiv HEP-TH citation graph

Hyperpartisan News Detection

ade_corpus_v2Ade_corpus_v2_classification

financial_phrasebank

catalonia_independence

book-text-classifier

New_York_Times_Topics

SemEval 2014 Task 4 (Restaurants)

NSFW-Safe-Dataset

amazon_reviews_multi

인공지능의 미래를 구축하세요

정보

회사 소개 데이터 세트 도움말

제품

뉴스 논문 노트북 데이터 세트 위키

링크

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

메인 페이지

GPU

콘솔
문서
가격

Pulse

뉴스

리소스

논문
노트북
데이터 세트
위키

벤치마크

SOTA
LLM 모델
GPU 리더보드

커뮤니티

이벤트

유틸리티

정보 서비스 이용약관 개인정보 처리방침
한국어

Command Palette

Search for a command to run...

HyperAI
SOTA
텍스트 분류

텍스트 분류

텍스트 분류는 자연어 처리의 핵심 작업으로, 텍스트 데이터를 미리 정의된 범주로 분류하는 것을 목표로 합니다. 이 작업은 텍스트 내용을 분석하고 주제, 감정, 의도 등의 특성을 식별하여 정보를 효율적으로 조직하고 검색할 수 있게 합니다. 최근에는 XLNet과 RoBERTa와 같은 딥러닝 모델이 텍스트 분류의 성능을 크게 향상시켜 기술적 발전을 이끌고 있습니다. GLUE와 AGNews와 같은 벤치마크 데이터셋은 이러한 모델의 효과성을 평가하는 데 널리 사용되고 있습니다.

Automatic Label Error Correction

UK Key Stage Readability

OneStopEnglish (Readability Assessment)

RoBERTa-RF-T1 hybrid

ULMFiT (pre-trained vocab, no gradual unfreezing)

WeeBit (Readability Assessment)

BART-RF-T1 hybrid

Character-BERT+RS

ThreatGram 101 - Extreme Telegram Data

IMDb Movie Reviews

Logistic Regression

Custom Legal-BERT

Terms of Service

BioLinkBERT (large)

An Amharic News Text classification Dataset

Naive Bayes using Tf-idf features

Social media attributions of YouTube comments

MuLD (Character Type)

This is not a Dataset

AffCon 2020 Emotion Detection

Twitter Sentiment Analysis

Logistic Regression

TRAC2-English. Task2.

SILICONE Benchmark

TRAC2-Benghali. Task 2.

RusAge: Corpus for Age-Based Text Classification

LSVC + linguistic features + publishing attributes

WNUT-2020 Task 2

Adverse Drug Events (ADE) Corpus

Arxiv HEP-TH citation graph

Hyperpartisan News Detection

ade_corpus_v2Ade_corpus_v2_classification

financial_phrasebank

catalonia_independence

book-text-classifier

New_York_Times_Topics

SemEval 2014 Task 4 (Restaurants)

NSFW-Safe-Dataset

amazon_reviews_multi

인공지능의 미래를 구축하세요

정보

회사 소개 데이터 세트 도움말

제품

뉴스 논문 노트북 데이터 세트 위키

링크

© HyperAI

GitHub Discord X (formerly Twitter)