Command Palette
Search for a command to run...
ArabicMMLU
ArabicMMLU est un benchmark d'évaluation de la compréhension multimodale conçu spécifiquement pour l'arabe. Il vise à tester et à améliorer de manière exhaustive les capacités des modèles de traitement du langage naturel en matière de compréhension et de raisonnement multimodal dans un environnement arabe. Ce benchmark couvre divers types de tâches, notamment la classification de texte, l'analyse de sentiment et le couplage sémantique, ce qui contribue à faire progresser la technologie de traitement de l'information arabe et à améliorer la précision et la robustesse des modèles dans des scénarios d'application réels.