日期

10 个月前

数据集组织

论文 URL

2509.04292

标签

文本生成

IFEval-Inverse 是由 ByteDance Seed 联合南京大学、清华大学等机构于 2025 年发布的一个面向大型语言模型的对抗性指令评测数据集，相关论文成果为「Inverse IFEval: Can LLMs Unlearn Stubborn Training Conventions to Follow Real Instructions?」，旨在检验模型在面对逆向或反常指令时能否打破训练惯性，实现真正的指令遵循。该数据集包含 1,012 条高质量中英双语问题样本，涵盖 8 种类型的反常指令挑战，包括问题纠错、故意文本错误、无注释代码、反常格式化、故意错误答案、诱导式提问、中途修改指令和反事实问答，并涉及 23 个不同领域。每条样本都经过人机结合的筛选与验证，并采用 LLM-as-a-Judge 自动评分机制，适用于评估和提升模型在非传统指令场景下的适应性和鲁棒性，也为研究如何缓解模型的认知惯性提供了重要基准。

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集在 Discord 上讨论

日期

10 个月前

数据集组织

论文 URL

2509.04292

标签

文本生成

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Groundsource 全球洪水事件数据集

RoVid-X 机器人视频生成数据集

LightOnOCR-mix-0126 文本转录数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Groundsource 全球洪水事件数据集

RoVid-X 机器人视频生成数据集

LightOnOCR-mix-0126 文本转录数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Groundsource 全球洪水事件数据集

RoVid-X 机器人视频生成数据集

LightOnOCR-mix-0126 文本转录数据集

相关数据集

Groundsource 全球洪水事件数据集

RoVid-X 机器人视频生成数据集

LightOnOCR-mix-0126 文本转录数据集

Command Palette

IFEval-Inverse 逆向指令评测数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

IFEval-Inverse 逆向指令评测数据集

相关数据集

Groundsource 全球洪水事件数据集

RoVid-X 机器人视频生成数据集

LightOnOCR-mix-0126 文本转录数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

IFEval-Inverse 逆向指令评测数据集

相关数据集

Groundsource 全球洪水事件数据集

RoVid-X 机器人视频生成数据集

LightOnOCR-mix-0126 文本转录数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Groundsource 全球洪水事件数据集

RoVid-X 机器人视频生成数据集

LightOnOCR-mix-0126 文本转录数据集

相关数据集

Groundsource 全球洪水事件数据集

RoVid-X 机器人视频生成数据集

LightOnOCR-mix-0126 文本转录数据集