Command Palette
Search for a command to run...
PhysToolBench 물리 도구 작업 데이터 세트
PhysToolBench는 홍콩과학기술대학교(광저우)가 홍콩과학기술대학교, 베이징항공우주대학교 및 기타 기관들과 협력하여 2025년에 공개한 시각 언어 질의응답(VQA) 데이터셋입니다. 관련 연구 논문의 제목은 "..."입니다.PhysToolBench: MLLM을 위한 물리적 도구 이해 벤치마킹이 연구의 목적은 다중 모드 대규모 언어 모델(MLLM)이 물리적 도구를 식별, 이해 및 생성하는 능력을 평가하는 것입니다. 이 데이터세트는 일상생활, 산업, 야외 활동, 업무 환경 등 다양한 시나리오를 포괄하는 1,000개 이상의 이미지-텍스트 쌍을 포함하고 있습니다. 쉬움, 보통, 어려움의 세 가지 난이도로 구분되어 있으며, 작업 구조는 다음과 같습니다.
- 도구 생성
- 도구 인식
- 도구 이해

데이터 세트 예제