Command Palette

Search for a command to run...

SubLlME 基于排名相关性预测的数据高效评估子集选择方法

日期

2 个月前

机构

论文链接

2025.acl-long.1477

基于排名相关性预测的数据高效评估子集选择方法(Subset Selection via Rank Correlation Prediction for Data-Efficient LLM Evaluation,简称 SubLlME)是由惠普实验室等团队于 2025 年 7 月提出的一种新颖评估方法,旨在通过排名相关性预测,在无需全量评测的情况下,实现 高效、准确的模型性能评估。相关研究论文为「SubLIME: Subset Selection via Rank Correlation Prediction for Data-Efficient LLM Evaluation」,该论文已获 ACL 25 最佳主题论文奖。

SubLIME 借鉴奥林匹克数学竞赛的评测策略,通过智能选取一个小规模但具有代表性的子集,预测模型之间在完整评测中的相对表现,从而大幅降低评估成本(可减少 80%–99%),同时保持高度一致的模型排名结果。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供