HyperAI超神经
Back to Headlines

密歇根大学研发新AI检测工具:高精度低误报率,助力打击虚假信息

2 days ago

密歇根大学的一个研究团队开发了一种新的工具“Liketropy”,旨在准确检测由人工智能生成的文本,同时尽量减少误判。随着AI生成的内容日益增多,区分机器与人类创作变得越发困难,这对学术界和公共政策领域尤为重要。“Liketropy”结合了概率和熵这两个统计学概念,通过设计零训练统计测试(即不依赖于预先训练的数据)来识别文本是由人类还是大型语言模型(LLM)产生的。 该工具的工作原理是基于文本本身的统计特性,比如词语的使用频率和出乎意料程度,从而判断其更可能为人类所写还是AI生成。在大规模数据集上的测试显示,即使在模型对公众保密或AI文本特意设计以绕过检测器的情况下,“Liketropy”也能表现出色。当针对特定的LLM进行设计时,它平均准确率超过96%,误判率低至1%。 团队成员特别关注的是公平性问题,尤其是国际学生和非英语母语者可能因为写作口吻或句式结构而被误认为使用了AI辅助工具的问题。博士生Tara Radvand表示,他们的目标是在确保不对人类作者误判的同时,有效识别AI生成的文本。Radvand指出,这项工具能帮助这些学生在提交之前,以一种低风险、透明的方式自我检查写作中的潜在“AI特征”。 未来,研究团队计划将“Liketropy”应用到更多领域,例如法律、科学和大学招生等,每个领域可能有不同的谨慎-效果平衡阈值。此外,他们还希望与校方和企业领导商讨,将其作为辅助工具,验证文本是否由校内的人工智能平台(如U-M GPT和Maizey AI助手)生成,而不是外部模型(如ChatGPT)。 AI检测工具的关键应用场景之一在于遏制社交媒体上的虚假信息传播。一些恶意工具会训练LLM采取极端观点并发布虚假信息,操纵公众舆论。因此,开发能够高效识别此类内容和评论的工具显得尤为重要。早期发现可以减少有害信息的传播范围,保护公共讨论的完整性。 业内人士认为,这样的检测工具填补了现有市场的空白,特别是在学术诚信和反假信息方面有着巨大的应用前景。密歇根大学作为研究机构,长期以来在人工智能和数据分析领域处于领先地位,“Liketropy”的成功不仅展示了该校在这一领域的创新实力,也为未来的科技发展提供了新思路。该研究目前发表在arXiv预印本服务器上,并获得密歇根学生跨学科统计科学研讨会的最佳展示奖,得到了巴黎女性机器学习和数据科学社区的认可。

Related Links