稳健且细粒度的AI生成文本检测
Ram Mohan Rao Kadiyala, Siddartha Pullakhandam, Kanwal Mehreen, Drishti Sharma, Siddhant Gupta, Jebish Purbey, Ashay Srivastava, Subhasya TippaReddy, Arvind Reddy Bobbili, Suraj Telugara Chandrashekhar, Modabbir Adeeb, Srinadh Vura, Hamza Farooq
发布日期: 4/17/2025

摘要
理想的机器生成内容检测系统应能够对任何生成器有效工作,因为每天都有越来越多的先进大语言模型(LLM)出现。现有的系统通常在识别较短文本中的AI生成内容时存在困难。此外,并非所有文本都是完全由人类或大语言模型创作的,因此我们更加关注部分案例,即人类与大语言模型共同创作的文本。本文介绍了一组用于标记分类任务的模型,这些模型是在大量人类与机器共同创作的文本上训练的,并在未见过的领域、未见过的生成器、非母语作者的文本以及对抗性输入的文本上表现出色。我们还引入了一个包含超过240万条此类文本的新数据集,这些文本主要由23种语言中的多个流行专有大语言模型共同创作。我们还展示了模型在每个领域和每个生成器上的每条文本性能的结果。其他发现包括对抗方法性能的对比、输入文本长度的影响以及生成文本与原始人类创作文本特征的比较。