Text Generation
テキスト生成は、自然言語処理の分野におけるタスクで、アルゴリズムを使用して人間が書いたテキストと区別がつきにくい内容を生成することを目指しています。このタスクでは、マルコフ過程やLSTMなどの深層生成モデルが利用され、最近の最先端の手法にはBART、GPT、GANベースのアプローチが含まれます。システム評価には、人間によるスコアリングやMETEOR、ROUGE、BLEUなどの自動評価指標がしばしば用いられます。テキスト生成は、対話システム、自動要約、機械翻訳など、多くの応用分野で重要な価値を持っています。
ADGEN
AI2 Reasoning Challenge (25-Shot)
AI2 Reasoning Challenge TR
Alpaca-Eval (PT)
AlpacaEval
ARC-Challenge (PT)
Assin2 RTE
Assin2 STS
BBH (3-Shot)
BLUEX (No Images)
CALAME-PT
Censorship (0-shot)
Chinese Poems
RankGAN
CMU-SE
STWGAN-GP
CNN/Daily Mail
PALM
COCO Captions
LeakGAN
CommonGen
UniLM
Creativity (0-shot)
CrimeStats
CSL
Czech restaurant information
DailyDialog
DART
Drop (3-Shot)
EMNLP2017 WMT
LeakGAN
ENEM Challenge (No Images)
FaQuAD NLI
GPQA (0-shot)
GSM8k (5-shot)
GSM8k TR
HarmfulQA
GPT-4
HateBR Binary
HellaSwag (10-Shot)
HellaSwag (PT)
HellaSwag TR
Humanness (0-shot)
IFEval (0-Shot)
Internet
LAMBADA-PT
LCSTS
LDC2016E25
MATH Lvl 5 (4-Shot)
MMLU (5-Shot)
MMLU-PRO (5-shot)
MMLU TR
MT-Bench
MT-Bench-jp
MuSR (0-shot)
OAB Exams
One Billion Word
WGANGP + DGflow
Open-Mindedness (0-shot)
OpenWebText
PolContro
PT Hate Speech Binary
ReDial
UniCRS
ROCStories
Beam search + A*esque (sample)
SciQ
Stories/Jokes
Talking (0-shot)
TruthfulQA
TruthfulQA (0-shot)
TruthfulQA (PT)
TruthfulQA TR
tweetSentBR
Unruly
W/10
WikiText-103
Winogrande (5-shot)
Winogrande TR
World Knowledge (0-shot)
Yahoo Questions
Aggressive VAE