Command Palette

Search for a command to run...

EditReward-Bench 图像编辑评测数据集

日期

6 天前

机构

chinese academy of sciences (中国科学院)

论文链接

2509.23909

EditReward-Bench 是由中国科学技术大学联合中国科学院自动化研究所、北京智源人工智能研究院发布的一个面向图像编辑奖励模型的系统化评测基准,相关论文成果为「EditScore: Unlocking Online RL for Image Editing via High-Fidelity Reward Modeling」,旨在从指令遵循、一致性保持与整体质量三个核心维度全面评估奖励模型的判别能力。

数据集共包含 3,072 条由专家标注的偏好对比数据,覆盖 4 大类、 13 种具有代表性的图像编辑任务,全面囊括常见与复杂的真实应用场景。所有候选编辑结果均由 11 种异构图像编辑模型生成,包括开源系统与领先的专有编辑器,从而确保数据分布的丰富性与挑战性。

任务分类:

  • 主体类(Subject):主体添加、主体移除、主体替换
  • 外观类(Appearance):颜色修改、材质变换、风格迁移、色调调整
  • 场景类(Scene):背景替换、前景提取
  • 高级编辑类(Advanced):人像美化、文本修改、动作变化、混合编辑

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
EditReward-Bench 图像编辑评测数据集 | 数据集 | HyperAI超神经