使用ChatGPT时的大脑:在作文写作任务中使用AI助手导致的认知债务累积
Nataliya Kosmyna, Eugene Hauptmann, Ye Tong Yuan, Jessica Situ, Xian-Hao Liao, Ashly Vivian Beresnitzky, Iris Braunstein, Pattie Maes
发布日期: 6/11/2025

摘要
本研究探讨了大型语言模型(LLM)辅助作文写作的神经和行为后果。参与者被分为三组:大型语言模型组、搜索引擎组和仅大脑组(无工具)。每组在相同条件下完成了三个会话。在第四个会话中,大型语言模型组的用户被重新分配到仅大脑组(LLM-to-Brain),而仅大脑组的用户则被重新分配到大型语言模型条件(Brain-to-LLM)。共有54名参与者完成了第1至第3个会话,其中18名参与者完成了第4个会话。我们使用脑电图(EEG)评估了作文写作过程中的认知负荷,并通过自然语言处理(NLP)分析了作文,同时借助人类教师和人工智能裁判对作文进行了评分。各组之间的命名实体识别(NER)、n-gram模式和主题本体显示了组内同质性。脑电图揭示了显著的大脑连接差异:仅大脑组的参与者表现出最强且分布最广的网络;搜索引擎用户的参与度适中;而大型语言模型用户的连接性最弱。认知活动随着外部工具使用的增加而减少。在第四个会话中,从大型语言模型转到仅大脑组的参与者显示出α波和β波连接性的降低,表明参与度不足。从仅大脑组转到大型语言模型条件的用户则表现出更高的记忆回忆以及枕顶区和前额叶区域的激活,这与搜索引擎用户相似。自我报告的作文归属感在大型语言模型组最低,在仅大脑组最高。此外,大型语言模型用户难以准确引用自己的作品。尽管大型语言模型提供了即时便利,但我们的研究结果突显了潜在的认知成本。在四个月的时间内,大型语言模型用户在神经、语言和行为水平上始终表现不佳。这些结果引发了对长期依赖大型语言模型教育影响的担忧,并强调了深入探究人工智能在学习中作用的必要性。