Command Palette
Search for a command to run...
SubLlME 基于排名相关性预测的数据高效评估子集选择方法
基于排名相关性预测的数据高效评估子集选择方法(Subset Selection via Rank Correlation Prediction for Data-Efficient LLM Evaluation,简称 SubLlME)是由惠普实验室等团队于 2025 年 7 月提出的一种新颖评估方法,旨在通过排名相关性预测,在无需全量评测的情况下,实现 高效、准确的模型性能评估。相关研究论文为「SubLIME: Subset Selection via Rank Correlation Prediction for Data-Efficient LLM Evaluation」,该论文已获 ACL 25 最佳主题论文奖。
SubLIME 借鉴奥林匹克数学竞赛的评测策略,通过智能选取一个小规模但具有代表性的子集,预测模型之间在完整评测中的相对表现,从而大幅降低评估成本(可减少 80%–99%),同时保持高度一致的模型排名结果。