Command Palette
Search for a command to run...
T2I-CoReBench 是由中国科学技术大学联合快手科技 Kling 团队、香港大学于 2025 年提出的一个面向文本驱动图像生成模型的综合评测基准,相关论文成果为「Easier Painting Than Thinking: Can Text-to-Image Models Set the Stage, but Not Direct the Play?」,旨在同时衡量图像生成模型的组合能力与推理能力。
该数据集包含 1,080 条具有高度挑战性的提示,并配备约 13,500 个检查项,覆盖 12 个维度,用于逐项评估生成图像中每一个预期元素是否正确呈现。
数据构成
该数据集从两个维度设计提示与评估体系:
- 组合维度(Composition):围绕实体(instance)、属性(attribute)、关系(relation)三类场景图元素构建多种组合结构。
- 推理维度(Reasoning):基于演绎(deductive)、归纳(inductive)、溯因/反向推理(abductive)三种推理类型展开。
为促进细粒度评价,每个提示还配套一个是 / 否检查清单(checklist),对提示中隐含或显式要求的每个元素逐项标注其是否得到正确呈现。
