日期

10 个月前

面向语言模型预训练的多维质量数据筛选方法（A Multi-dimensional Data Selection Method for Pre-training Language Models，简称 Meta-rater）是由上海人工智能实验联合华东师范大学于 2025 年 6 月 4 日提出的一种多维数据选择方法，旨在通过学习最优权重，将专业性、可读性、推理性、干净程度四个维度与现有质量指标整合。相关论文成果为「Meta-rater: A Multi-dimensional Data Selection Method for Pre-training Language Models」，该论文已获 ACL 25 最佳主题论文奖。

Meta-rater 利用代理模型训练回归模型，预测验证集损失，从而识别最优的质量分数组合。实验结果表明，Meta-rater 能将 13 亿参数模型的收敛速度提高两倍，下游任务性能提升 3.23%，且这种优势可扩展至 72 亿参数模型。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

日期

10 个月前

世界动作模型 WAM

WAM 是一种面向具身智能与机器人领域的新型 AI 基础模型架构。

1 个月前

技能 Skills

Skills 是封装知识与流程的可复用能力模块，使 AI 从通用模型转变为专业智能体

3 个月前

Peak-Return Greedy Slicing

PRGS 显著增强了离线强化学习模型拼接高回报经验的能力。

2 个月前

安全比对方法 Deep Aligned Visual Safety Prompt

有效解决了 LVLM 安全对齐中的关键挑战。

3 个月前

WorldGen

WorldGen 能够打造出几何统一、视觉丰富且实时渲染高效的世界。

3 个月前

稠密检索器 Dense Retriever

稠密检索器负责从海量文档库中快速找出与查询语义最相关的段落，是检索增强生成系统的核心基础组件。

2 个月前

空间理论 Theory of Space

空间理论是指智能体通过主动探索在不完全信息环境中构建、更新并利用空间信念的能力框架。

2 个月前

思维引导的强化学习框架 Guided Thought Reinforcement

GTR 能在复杂视觉环境中引导模型推理，防止「思维崩溃」

2 个月前

SoCE 类专家 Soup

SoCE 是一种基于自动类别感知专家选择机制、结合多基准任务的模型优化范式。

3 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

多维度预训练数据筛选框架 Meta-rater

用 AI 构建 AI

HyperAI Newsletters

Command Palette

多维度预训练数据筛选框架 Meta-rater

相关百科

世界动作模型 WAM

技能 Skills

Peak-Return Greedy Slicing

安全比对方法 Deep Aligned Visual Safety Prompt

WorldGen

稠密检索器 Dense Retriever

空间理论 Theory of Space

思维引导的强化学习框架 Guided Thought Reinforcement

SoCE 类专家 Soup

用 AI 构建 AI

HyperAI Newsletters

Command Palette

多维度预训练数据筛选框架 Meta-rater

相关百科

世界动作模型 WAM

技能 Skills

Peak-Return Greedy Slicing

安全比对方法 Deep Aligned Visual Safety Prompt

WorldGen

稠密检索器 Dense Retriever

空间理论 Theory of Space

思维引导的强化学习框架 Guided Thought Reinforcement

SoCE 类专家 Soup

用 AI 构建 AI

HyperAI Newsletters

相关百科

世界动作模型 WAM

技能 Skills

Peak-Return Greedy Slicing

安全比对方法 Deep Aligned Visual Safety Prompt

WorldGen

稠密检索器 Dense Retriever

空间理论 Theory of Space

思维引导的强化学习框架 Guided Thought Reinforcement

SoCE 类专家 Soup

相关百科

世界动作模型 WAM

技能 Skills

Peak-Return Greedy Slicing

安全比对方法 Deep Aligned Visual Safety Prompt

WorldGen

稠密检索器 Dense Retriever

空间理论 Theory of Space

思维引导的强化学习框架 Guided Thought Reinforcement

SoCE 类专家 Soup