WebClick 网页理解基准数据集
WebClick 是一个高质量的网页理解基准数据集,用于评估多模态模型和智能体理解网页界面、解读用户指令以及在数字环境中采取精准行动的能力。
该数据集包含来自 100 多个网站的 1,639 张英文网页截图,这些截图配有精确标注的自然语言指令和像素级点击目标。
数据集结构:
- agentbrowse(36%):SurferH 代理在解决 WebVoyager 的 Web 检索任务时遇到的页面
- humanbrowse(31.8%):人类执行日常任务(电子购物、旅行计划、个人组织)时与之交互的页面和元素
- calendars(32.2%):专注于日历界面的专门子集,这是 UI 理解模型的一个已知挑战
WebClick.torrent
做种 1正在下载 0已完成 1总下载次数 2