PhysToolBench Physik-Tool-Aufgabendatensatz
Datum
Paper-URL
PhysToolBench ist ein Datensatz für visuelle Sprachbeantwortung (VQA), der 2025 von der Hong Kong University of Science and Technology (Guangzhou) in Zusammenarbeit mit der Hong Kong University of Science and Technology, der Beijing University of Aeronautics and Astronautics und weiteren Institutionen veröffentlicht wurde. Die zugehörige Forschungsarbeit trägt den Titel „…“.PhysToolBench: Benchmarking des Verständnisses physikalischer Werkzeuge für MLLMsZiel der Studie ist es, die Fähigkeit multimodaler großer Sprachmodelle (MLLMs) zu bewerten, physische Werkzeuge zu identifizieren, zu verstehen und zu erstellen.
Dieser Datensatz enthält über 1.000 Bild-Text-Paare aus verschiedenen Bereichen wie Alltag, Industrie, Outdoor-Aktivitäten und Berufsleben. Er ist in drei Schwierigkeitsstufen unterteilt: leicht, mittel und schwer. Die Aufgabenstruktur ist wie folgt:
- Werkzeugerstellung
- Werkzeugerkennung
- Werkzeugverständnis

KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.