Command Palette
Search for a command to run...
Ensemble De Données Des Tâches De l'outil Physique PhysToolBench
Date
Size
Paper URL
PhysToolBench est un ensemble de données de questions-réponses visuelles et linguistiques (VQA) publié en 2025 par l'Université des sciences et technologies de Hong Kong (Guangzhou), en collaboration avec l'Université des sciences et technologies de Hong Kong, l'Université d'aéronautique et d'astronautique de Pékin et d'autres institutions. L'article de recherche associé s'intitule « ... ».PhysToolBench : Évaluation comparative de la compréhension des outils physiques pour les MLLML’étude vise à évaluer la capacité des grands modèles de langage multimodaux (MLLM) à identifier, comprendre et créer des outils physiques.
Cet ensemble de données contient plus de 1 000 paires image-texte, couvrant divers contextes tels que la vie quotidienne, l’industrie, les activités de plein air et les environnements professionnels. Il est divisé en trois niveaux de difficulté : facile, moyen et difficile. La structure de la tâche est la suivante :
- Création d'outils
- Reconnaissance des outils
- Compréhension de l'outil

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.