日期

2 年前

废话比率 (Crapness Ratio) 是一个衡量标准，用于评估大型语言模型（LLM）给出的答案中废话或无效信息的比例。这个概念是由菲尔兹奖得主、剑桥大学研究主任 Timothy Gowers 于 2024 年提出来的。他在尝试使用 GPT-4o 解决动物过河难题时，提出了这个基准，即 LLM 给出的总答案与正确答案之间的比率。指出 GPT-4o 在最简单的题目上的错误，Claude 3.5 也无法幸免。该现象引发了对大型语言模型是否真的能够推理和规划的质疑。通过这个比率，可以量化模型输出的废话程度，从而评估模型的性能和改进方向。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

日期

2 年前

Cache-to-Cache（C2C）

C2C 通过转换和融合模型间的键值（KV）缓存，实现直接的语义交流。

3 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

废话比率 Crapness Atio

用 AI 构建 AI

HyperAI Newsletters

Command Palette

废话比率 Crapness Atio

Cache-to-Cache（C2C）

用 AI 构建 AI

HyperAI Newsletters

Command Palette

废话比率 Crapness Atio

Cache-to-Cache（C2C）

用 AI 构建 AI

HyperAI Newsletters

Cache-to-Cache（C2C）

Cache-to-Cache（C2C）