HyperAI

メイン

GPU

コンソール
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
SOTA
言語モデル

言語モデル

言語モデルは、文書の次の単語や文字を予測するタスクであり、訓練された言語モデルはテキスト生成、テキスト分類、質問応答など、さまざまな自然言語処理タスクに適用できます。2010年代以降、ニューラル言語モデルがN-gramモデルに取って代わり、2020年代以降は大規模言語モデル（LLMs）が最先端の性能を達成する唯一の道となっています。これらのモデルの能力は、クロスエントロピーやパープレキシティなどの指標で評価され、一般的なデータセットにはWikiText-103、One Billion Word、Text8、C4、The Pileなどが含まれます。

Penn Treebank (Word Level)

GPT-3 (Zero-Shot)

GPT-2 (48 layers, h=1600)

Test-Time Fine-Tuning with SIFT + Llama-3.2 (3B)

SparseGPT (175B, 50% Sparsity)

GPT-3 175B (Few-Shot)

One Billion Word

OmniNetT (Large)

Penn Treebank (Character Level)

Mogrifier LSTM + dynamic eval

Transformer-XL + RMS dynamic eval

Spirit-LM (Expr.)

GLM-130B (3-shot)

FewCLUE (EPRSTMT)

Hybrid 4-gram VietMed-Train + ExtraText

FewCLUE (OCNLI-FC)

FewCLUE (CLUEWSC-FC)

FewCLUE (CHID-FC)

CLUE (CMRC2018)

CLUE (OCNLI_50K)

FewCLUE (BUSTM)

PubMed Cognitive Control Abstracts

PTB Diagnostic ECG Database

USPTO Backgrounds

Transformer-LS (small)

Gutenberg PG-19

PAR Transformer 24B

100 sleep nights of 8 caregivers

2000 HUB5 English

Arxiv HEP-TH citation graph

Curation Corpus

Transformer-LS (small)

Ethereum Phishing Transaction Network

language-modeling-recommendation

人工知能の未来を築く

概要

当社についてデータセットのヘルプ

製品

ニュースノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
SOTA
言語モデル

言語モデル

言語モデルは、文書の次の単語や文字を予測するタスクであり、訓練された言語モデルはテキスト生成、テキスト分類、質問応答など、さまざまな自然言語処理タスクに適用できます。2010年代以降、ニューラル言語モデルがN-gramモデルに取って代わり、2020年代以降は大規模言語モデル（LLMs）が最先端の性能を達成する唯一の道となっています。これらのモデルの能力は、クロスエントロピーやパープレキシティなどの指標で評価され、一般的なデータセットにはWikiText-103、One Billion Word、Text8、C4、The Pileなどが含まれます。

Penn Treebank (Word Level)

GPT-3 (Zero-Shot)

GPT-2 (48 layers, h=1600)

Test-Time Fine-Tuning with SIFT + Llama-3.2 (3B)

SparseGPT (175B, 50% Sparsity)

GPT-3 175B (Few-Shot)

One Billion Word

OmniNetT (Large)

Penn Treebank (Character Level)

Mogrifier LSTM + dynamic eval

Transformer-XL + RMS dynamic eval

Spirit-LM (Expr.)

GLM-130B (3-shot)

FewCLUE (EPRSTMT)

Hybrid 4-gram VietMed-Train + ExtraText

FewCLUE (OCNLI-FC)

FewCLUE (CLUEWSC-FC)

FewCLUE (CHID-FC)

CLUE (CMRC2018)

CLUE (OCNLI_50K)

FewCLUE (BUSTM)

PubMed Cognitive Control Abstracts

PTB Diagnostic ECG Database

USPTO Backgrounds

Transformer-LS (small)

Gutenberg PG-19

PAR Transformer 24B

100 sleep nights of 8 caregivers

2000 HUB5 English

Arxiv HEP-TH citation graph

Curation Corpus

Transformer-LS (small)

Ethereum Phishing Transaction Network

language-modeling-recommendation

人工知能の未来を築く

概要

当社についてデータセットのヘルプ

製品

ニュースノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)