Command Palette

Search for a command to run...

废话比率 Crapness Atio

日期

1 年前

废话比率 (Crapness Ratio) 是一个衡量标准,用于评估大型语言模型(LLM)给出的答案中废话或无效信息的比例。这个概念是由菲尔兹奖得主、剑桥大学研究主任 Timothy Gowers 于 2024 年提出来的。他在尝试使用 GPT-4o 解决动物过河难题时,提出了这个基准,即 LLM 给出的总答案与正确答案之间的比率。指出 GPT-4o 在最简单的题目上的错误,Claude 3.5 也无法幸免。该现象引发了对大型语言模型是否真的能够推理和规划的质疑。通过这个比率,可以量化模型输出的废话程度,从而评估模型的性能和改进方向。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供