HyperAI
Command Palette
Search for a command to run...
RubricHub 多领域生成任务数据集
RubricHub 是由理想汽车联合浙江大学于 2026 年发布的一个大规模、多领域生成任务的数据集,相关论文成果为 RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation 。该数据集提供基于评分标准的高质量监督,用于开放式生成任务。数据集通过自动化的粗到细评分标准生成框架构建,整合了原则引导合成、多模型聚合和难度演变等策略,以产生全面且高度区分的评价标准。
数据集构成:
- RuRL:包括 VeRL 训练格式的提示列表、数据来源、能力目标、奖励模型和附加信息等。
- RuFT:包括数据来源、模型输入提示、模型生成的响应、样本 ID 、评分标准及其评分细节等。
该数据集由社区用户贡献,仅供交流学习使用。如内容涉及侵权,请联系邮箱 [email protected] 以便及时审查和下架。