HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
SOTA
テキスト分類

テキスト分類

テキスト分類は、自然言語処理の主要なタスクの一つで、テキストデータを事前に定義されたカテゴリに分類することを目的としています。このタスクでは、テキストの内容を分析し、トピック、感情、意図などの特徴を特定することで、情報の効率的な整理と検索を実現します。近年、XLNetやRoBERTaなどの深層学習モデルがテキスト分類の性能を大幅に向上させ、技術的進歩を推進しています。これらのモデルの有効性を評価するために、GLUEやAGNewsなどのベンチマークデータセットが広く使用されています。

Automatic Label Error Correction

UK Key Stage Readability

OneStopEnglish (Readability Assessment)

RoBERTa-RF-T1 hybrid

ULMFiT (pre-trained vocab, no gradual unfreezing)

WeeBit (Readability Assessment)

BART-RF-T1 hybrid

Character-BERT+RS

ThreatGram 101 - Extreme Telegram Data

IMDb Movie Reviews

Logistic Regression

Custom Legal-BERT

Terms of Service

BioLinkBERT (large)

An Amharic News Text classification Dataset

Naive Bayes using Tf-idf features

Social media attributions of YouTube comments

MuLD (Character Type)

This is not a Dataset

AffCon 2020 Emotion Detection

Twitter Sentiment Analysis

Logistic Regression

TRAC2-English. Task2.

SILICONE Benchmark

TRAC2-Benghali. Task 2.

RusAge: Corpus for Age-Based Text Classification

LSVC + linguistic features + publishing attributes

WNUT-2020 Task 2

Adverse Drug Events (ADE) Corpus

Arxiv HEP-TH citation graph

Hyperpartisan News Detection

ade_corpus_v2Ade_corpus_v2_classification

financial_phrasebank

catalonia_independence

book-text-classifier

New_York_Times_Topics

SemEval 2014 Task 4 (Restaurants)

NSFW-Safe-Dataset

amazon_reviews_multi

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
SOTA
テキスト分類

テキスト分類

テキスト分類は、自然言語処理の主要なタスクの一つで、テキストデータを事前に定義されたカテゴリに分類することを目的としています。このタスクでは、テキストの内容を分析し、トピック、感情、意図などの特徴を特定することで、情報の効率的な整理と検索を実現します。近年、XLNetやRoBERTaなどの深層学習モデルがテキスト分類の性能を大幅に向上させ、技術的進歩を推進しています。これらのモデルの有効性を評価するために、GLUEやAGNewsなどのベンチマークデータセットが広く使用されています。

Automatic Label Error Correction

UK Key Stage Readability

OneStopEnglish (Readability Assessment)

RoBERTa-RF-T1 hybrid

ULMFiT (pre-trained vocab, no gradual unfreezing)

WeeBit (Readability Assessment)

BART-RF-T1 hybrid

Character-BERT+RS

ThreatGram 101 - Extreme Telegram Data

IMDb Movie Reviews

Logistic Regression

Custom Legal-BERT

Terms of Service

BioLinkBERT (large)

An Amharic News Text classification Dataset

Naive Bayes using Tf-idf features

Social media attributions of YouTube comments

MuLD (Character Type)

This is not a Dataset

AffCon 2020 Emotion Detection

Twitter Sentiment Analysis

Logistic Regression

TRAC2-English. Task2.

SILICONE Benchmark

TRAC2-Benghali. Task 2.

RusAge: Corpus for Age-Based Text Classification

LSVC + linguistic features + publishing attributes

WNUT-2020 Task 2

Adverse Drug Events (ADE) Corpus

Arxiv HEP-TH citation graph

Hyperpartisan News Detection

ade_corpus_v2Ade_corpus_v2_classification

financial_phrasebank

catalonia_independence

book-text-classifier

New_York_Times_Topics

SemEval 2014 Task 4 (Restaurants)

NSFW-Safe-Dataset

amazon_reviews_multi

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)