Command Palette
Search for a command to run...
EditReward-Bench 图像编辑评测数据集
EditReward-Bench 是由中国科学技术大学联合中国科学院自动化研究所、北京智源人工智能研究院发布的一个面向图像编辑奖励模型的系统化评测基准,相关论文成果为「EditScore: Unlocking Online RL for Image Editing via High-Fidelity Reward Modeling」,旨在从指令遵循、一致性保持与整体质量三个核心维度全面评估奖励模型的判别能力。
数据集共包含 3,072 条由专家标注的偏好对比数据,覆盖 4 大类、 13 种具有代表性的图像编辑任务,全面囊括常见与复杂的真实应用场景。所有候选编辑结果均由 11 种异构图像编辑模型生成,包括开源系统与领先的专有编辑器,从而确保数据分布的丰富性与挑战性。
任务分类:
- 主体类(Subject):主体添加、主体移除、主体替换
- 外观类(Appearance):颜色修改、材质变换、风格迁移、色调调整
- 场景类(Scene):背景替换、前景提取
- 高级编辑类(Advanced):人像美化、文本修改、动作变化、混合编辑