Multiple Choice Qa
Natürliche Sprachverarbeitung (NLP) ist ein Zweig der Künstlichen Intelligenz, der sich darauf konzentriert, Computern das Verstehen, Interpretieren und Erzeugen menschlicher Sprache zu ermöglichen. Ihr Ziel ist es, die Kommunikationslücke zwischen Menschen und Maschinen zu überbrücken und die Effizienz und Qualität der Informationsaustausch zu verbessern. Der Anwendungswert von NLP ist weitreichend, einschließlich intelligenter Kundenservice, Stimmungsanalyse, maschinellen Übersetzungen, Textzusammenfassungen und vielem mehr. Diese Anwendungen haben die Informatisierung der Gesellschaft und die intelligente Transformation von Unternehmen stark vorangetrieben.
BIG-bench (Hyperbaton)
BIG-bench (Movie Recommendation)
BIG-bench (Navigate)
BIG-bench (Novel Concepts)
BIG-bench (Ruin Names)
FrenchMedMCQA
CamemBERT
IndicGLUE WSTP Pa
MedMCQA
Meditron-70B (CoT + SC)
MMLU (Abstract Algebra)
GAL 30B (zero-shot)
MMLU (Anatomy)
Med-PaLM 2 (ER)
MMLU (Astronomy)
Chinchilla (few-shot, k=5)
MMLU (Clinical Knowledge)
MMLU (College Biology)
Chinchilla (few-shot, k=5)
MMLU (College Chemistry)
Chinchilla (few-shot, k=5)
MMLU (College Computer Science)
Chinchilla (few-shot, k=5)
MMLU (College Mathematics)
GAL 120B (zero-shot)
MMLU (College Medicine)
MMLU (College Physics)
MMLU (Econometrics)
Gopher (few-shot, k=5)
MMLU (Electrical Engineer)
GAL 120B (zero-shot)
MMLU (Elementary Mathematics)
Chinchilla (few-shot, k=5)
MMLU (Formal Logic)
Gopher (few-shot, k=5)
MMLU (High School Biology)
Chinchilla (few-shot, k=5)
MMLU (High School Chemistry)
Chinchilla (few-shot, k=5)
MMLU (High School Computer Science)
GAL 120B (zero-shot)
MMLU (High School Mathematics)
GAL 120B (zero-shot)
MMLU (High School Physics)
MMLU (High School Statistics)
MMLU (Machine Learning)
Chinchilla (few-shot, k=5)
MMLU (Medical Genetics)
MMLU (Professional medicine)