WebClick 웹 페이지 이해 벤치마크 데이터 세트
WebClick은 멀티모달 모델과 에이전트가 웹 인터페이스를 이해하고, 사용자 명령을 해석하고, 디지털 환경에서 정확한 조치를 취하는 능력을 평가하기 위한 고품질 웹 이해 벤치마크 데이터 세트입니다.
이 데이터 세트에는 100개 이상의 웹사이트에서 가져온 1,639개의 영어 웹페이지 스크린샷이 포함되어 있으며, 정확하게 주석이 달린 자연어 설명과 픽셀 수준의 클릭 대상이 함께 제공됩니다.
데이터 세트 구조:
- agentbrowse(36%): WebVoyager의 웹 검색 작업을 해결할 때 SurferH 에이전트가 발견한 페이지
- humanbrowse(31.8%): 사람들이 일상 업무(e-쇼핑, 여행 계획, 개인 정리)를 수행할 때 상호 작용하는 페이지 및 요소
- 캘린더(32.2%): UI 이해 모델에 대한 알려진 과제인 캘린더 인터페이스의 특수 하위 집합에 초점을 맞춥니다.
WebClick.torrent
시딩 1다운로드 중 0완료됨 1총 다운로드 횟수 2