HyperAI

Mmr Total

La tâche totale MMR dans le benchmark de lecture multi-modale (MMR) vise à évaluer les performances globales du modèle dans la gestion de 11 sous-tâches différentes, incluant le texte, la police, les éléments visuels, les boîtes de délimitation, les relations spatiales et le positionnement de base. Cette tâche mesure de manière exhaustive la capacité de compréhension multi-modale du modèle en additionnant les scores de chaque sous-tâche, offrant une référence cruciale pour la recherche et les applications dans le domaine de la vision par ordinateur.