Command Palette
Search for a command to run...
VenusBench-GD 크로스 플랫폼 인터페이스 이해 데이터 세트
VenusBench-GD는 그래픽 사용자 인터페이스(GUI) 요소의 현지화 및 이해를 위한 데이터셋으로, Ant Group이 iMean AI와 협력하여 2025년에 출시했습니다. 관련 연구 논문은 다음과 같습니다... VenusBench-GD: 다양한 접지 작업에 적합한 종합적인 멀티 플랫폼 GUI 벤치마크본 연구의 목표는 다양한 플랫폼 인터페이스에서 자연어 지시에 따라 목표 인터페이스 요소를 정확하게 식별하고 위치를 파악하는 모델의 능력을 평가하는 것입니다. 이 데이터셋은 기본 현지화와 고급 추론이라는 두 가지 작업을 포괄하는 6,166개의 수동 레이블링된 샘플로 구성되어 있습니다. 각 샘플은 인터페이스 스크린샷과 해당 자연어 명령어로 이루어져 있습니다. 데이터는 웹, 모바일, 데스크톱 플랫폼을 아우르는 97개의 다양한 애플리케이션과 웹사이트에서 수집되었으며, 중국어 및 영어 인터페이스를 모두 포함합니다. 기본 작업은 주로 인터페이스 요소 유형, 텍스트 내용, 공간 관계 및 시각적 외관에 대한 모델의 이해도를 평가합니다. 고급 작업은 추론, 기능 이해, 존재하지 않는 대상의 합리적인 거부 등을 추가로 포함하여 모델의 전반적인 인터페이스 이해 및 의미 추론 능력에 더 높은 수준을 요구합니다. 다단계 자동 생성 및 수동 검토 과정을 통해 이 데이터셋은 규모를 유지하면서 주석의 노이즈와 모호성을 효과적으로 줄여 GUI 에이전트 및 멀티모달 모델 평가를 위한 신뢰할 수 있는 데이터 기반을 제공합니다.
