HyperAI超神经

在OpenReview因代码漏洞导致审稿人身份大规模泄露的“开盒事件”仅过去两周后，国际机器学习顶会ICLR再次陷入信任危机。AI内容检测机构GPTZero最新调查发现，在随机抽取的300篇ICLR 2026投稿论文中，超过50篇存在严重AI幻觉问题，包括伪造参考文献、捏造作者信息、编造实验数据等，部分论文甚至在同行评审中获得均分8.0的高分，具备冲击口头报告（Oral）或特别关注（Spotlight）的潜力。这一结果令人震惊，因为ICLR组委会早在今年8月27日就发布了严格规范，明确要求作者对AI生成内容负责，严禁伪造数据或误导性陈述。然而，现实却暴露出评审体系的严重漏洞。GPTZero的检测显示，16%的抽检样本存在无法验证的引文，按ICLR 2026近2万篇投稿总量推算，可能有数千篇存在学术瑕疵的论文正混迹于评审流程。典型案例包括题为《TamperTok》的论文，其引用的NeurIPS 2023论文标题与年份真实，但作者名单被完全篡改，四位审稿人未察觉，仍给出8.0高分。另一篇《MixtureVitae》则采用“真假参半”策略，保留真实作者前三位，后几位则虚构或拼凑，极具欺骗性。更荒诞的是，一篇名为《Safe-LLM》的论文在评审中竟赫然标注“Published at ICLR 2025”，而另一篇《IMPQ》论文虽提供真实arXiv ID，但链接指向的论文内容与引用信息完全不符，属于典型的“挂羊头卖狗肉”。这些现象背后，是AI辅助研究泛滥与评审资源严重不足的结构性矛盾。ICLR 2026收到1.95万篇投稿，产生超7.5万条评审意见，而合格审稿人数量有限，导致评审质量被稀释。有数据显示，约21%的评审意见由AI生成，超半数带有AI辅助痕迹。这已形成“用AI对抗AI”的恶性循环：作者用AI写论文，审稿人用AI写意见，而AI生成的“合理”内容反而更易通过审查。尽管ICLR新规要求作者公开AI使用并承担内容责任，但仅靠道德自律和事后追责已难以为继。当前的同行评审流程缺乏对AI幻觉的有效技术拦截手段，尤其在面对海量投稿时，基础的文献核查已成巨大人力负担。若不建立自动化检测机制、强化审稿人责任、推动AI生成内容可追溯，真正具有创新价值的人类研究将被淹没在由模型生成的“伪科学”洪流中。此次事件再次敲响警钟：AI技术正深刻重塑学术生态，但其带来的伦理与治理挑战，远未得到充分应对。顶级会议的公信力，正面临前所未有的考验。

相关链接

相关链接

相关链接

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

Command Palette

ICLR 2026陷学术信任危机，AI幻觉论文曝光数千投稿或存瑕疵

相关链接

Command Palette

ICLR 2026陷学术信任危机，AI幻觉论文曝光数千投稿或存瑕疵

相关链接

Command Palette

ICLR 2026陷学术信任危机，AI幻觉论文曝光数千投稿或存瑕疵

相关链接

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%