Command Palette
Search for a command to run...
Ensemble De Données Des Tâches De l'outil Physique PhysToolBench
Date
URL de l'article
PhysToolBench est un ensemble de données de questions-réponses visuelles et linguistiques (VQA) publié en 2025 par l'Université des sciences et technologies de Hong Kong (Guangzhou), en collaboration avec l'Université des sciences et technologies de Hong Kong, l'Université d'aéronautique et d'astronautique de Pékin et d'autres institutions. L'article de recherche associé s'intitule « ... ».PhysToolBench : Évaluation comparative de la compréhension des outils physiques pour les MLLML’étude vise à évaluer la capacité des grands modèles de langage multimodaux (MLLM) à identifier, comprendre et créer des outils physiques.
Cet ensemble de données contient plus de 1 000 paires image-texte, couvrant divers contextes tels que la vie quotidienne, l’industrie, les activités de plein air et les environnements professionnels. Il est divisé en trois niveaux de difficulté : facile, moyen et difficile. La structure de la tâche est la suivante :
- Création d'outils
- Reconnaissance des outils
- Compréhension de l'outil

Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.