HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
SOTA
Modélisation linguistique

Modélisation linguistique

Le modèle de langage est la tâche de prédire le prochain mot ou caractère dans un document, et les modèles de langage formés peuvent être appliqués à diverses tâches de traitement du langage naturel telles que la génération de texte, la classification de texte et la réponse aux questions. Depuis les années 2010, les modèles de langage neuronaux ont remplacé les modèles N-grammes, et après les années 2020, les grands modèles de langage (LLMs) sont devenus l'unique voie pour atteindre des performances de pointe. Les capacités de ces modèles sont évaluées à l'aide de métriques comme l'entropie croisée et la perplexité, avec des ensembles de données courants incluant WikiText-103, One Billion Word, Text8, C4 et The Pile.

Penn Treebank (Word Level)

GPT-3 (Zero-Shot)

GPT-2 (48 layers, h=1600)

Test-Time Fine-Tuning with SIFT + Llama-3.2 (3B)

SparseGPT (175B, 50% Sparsity)

GPT-3 175B (Few-Shot)

One Billion Word

OmniNetT (Large)

Penn Treebank (Character Level)

Mogrifier LSTM + dynamic eval

Transformer-XL + RMS dynamic eval

Spirit-LM (Expr.)

GLM-130B (3-shot)

FewCLUE (EPRSTMT)

Hybrid 4-gram VietMed-Train + ExtraText

FewCLUE (OCNLI-FC)

FewCLUE (CLUEWSC-FC)

FewCLUE (CHID-FC)

CLUE (CMRC2018)

CLUE (OCNLI_50K)

FewCLUE (BUSTM)

PubMed Cognitive Control Abstracts

PTB Diagnostic ECG Database

USPTO Backgrounds

Transformer-LS (small)

Gutenberg PG-19

PAR Transformer 24B

100 sleep nights of 8 caregivers

2000 HUB5 English

Arxiv HEP-TH citation graph

Curation Corpus

Transformer-LS (small)

Ethereum Phishing Transaction Network

language-modeling-recommendation

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
SOTA
Modélisation linguistique

Modélisation linguistique

Le modèle de langage est la tâche de prédire le prochain mot ou caractère dans un document, et les modèles de langage formés peuvent être appliqués à diverses tâches de traitement du langage naturel telles que la génération de texte, la classification de texte et la réponse aux questions. Depuis les années 2010, les modèles de langage neuronaux ont remplacé les modèles N-grammes, et après les années 2020, les grands modèles de langage (LLMs) sont devenus l'unique voie pour atteindre des performances de pointe. Les capacités de ces modèles sont évaluées à l'aide de métriques comme l'entropie croisée et la perplexité, avec des ensembles de données courants incluant WikiText-103, One Billion Word, Text8, C4 et The Pile.

Penn Treebank (Word Level)

GPT-3 (Zero-Shot)

GPT-2 (48 layers, h=1600)

Test-Time Fine-Tuning with SIFT + Llama-3.2 (3B)

SparseGPT (175B, 50% Sparsity)

GPT-3 175B (Few-Shot)

One Billion Word

OmniNetT (Large)

Penn Treebank (Character Level)

Mogrifier LSTM + dynamic eval

Transformer-XL + RMS dynamic eval

Spirit-LM (Expr.)

GLM-130B (3-shot)

FewCLUE (EPRSTMT)

Hybrid 4-gram VietMed-Train + ExtraText

FewCLUE (OCNLI-FC)

FewCLUE (CLUEWSC-FC)

FewCLUE (CHID-FC)

CLUE (CMRC2018)

CLUE (OCNLI_50K)

FewCLUE (BUSTM)

PubMed Cognitive Control Abstracts

PTB Diagnostic ECG Database

USPTO Backgrounds

Transformer-LS (small)

Gutenberg PG-19

PAR Transformer 24B

100 sleep nights of 8 caregivers

2000 HUB5 English

Arxiv HEP-TH citation graph

Curation Corpus

Transformer-LS (small)

Ethereum Phishing Transaction Network

language-modeling-recommendation

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)