Llm
Métriques de performance des modèles IA grand public sur diverses tâches, mettant en valeur la technologie de pointe
Benchmarks de performance des modèles IA
Métriques de performance des modèles IA grand public sur diverses tâches, mettant en valeur la technologie de pointe
multimodal
78 articles | 0 benchmarks
reasoning
60 articles | 0 benchmarks
understanding
47 articles | 0 benchmarks
other
35 articles | 0 benchmarks
knowledge
27 articles | 0 benchmarks
agent
24 articles | 0 benchmarks
code
20 articles | 0 benchmarks
math
20 articles | 0 benchmarks
language
19 articles | 0 benchmarks
examination
17 articles | 0 benchmarks
safety
17 articles | 0 benchmarks
strong reasoning
15 articles | 0 benchmarks
long-context
10 articles | 0 benchmarks
creation
6 articles | 0 benchmarks
instruct
5 articles | 0 benchmarks