Llm
Leistungsmetriken der Mainstream-KI-Modelle bei verschiedenen Aufgaben, die den neuesten Stand der Technik präsentieren
KI-Modell-Leistungs-Benchmarks
Leistungsmetriken der Mainstream-KI-Modelle bei verschiedenen Aufgaben, die den neuesten Stand der Technik präsentieren
multimodal
78 Forschungsarbeiten | 0 Benchmarks
reasoning
60 Forschungsarbeiten | 0 Benchmarks
understanding
47 Forschungsarbeiten | 0 Benchmarks
other
35 Forschungsarbeiten | 0 Benchmarks
knowledge
27 Forschungsarbeiten | 0 Benchmarks
agent
24 Forschungsarbeiten | 0 Benchmarks
code
20 Forschungsarbeiten | 0 Benchmarks
math
20 Forschungsarbeiten | 0 Benchmarks
language
19 Forschungsarbeiten | 0 Benchmarks
examination
17 Forschungsarbeiten | 0 Benchmarks
safety
17 Forschungsarbeiten | 0 Benchmarks
strong reasoning
15 Forschungsarbeiten | 0 Benchmarks
long-context
10 Forschungsarbeiten | 0 Benchmarks
creation
6 Forschungsarbeiten | 0 Benchmarks
instruct
5 Forschungsarbeiten | 0 Benchmarks