AI 驱动人类奖励学习模型,有望助力心境障碍研究
谷歌深度思维与牛津大学的研究团队在《自然人类行为》期刊发表新研究,提出一种结合人工智能算法与心理学理论的新模型,旨在更精准地研究人类基于奖励的学习机制。研究指出,传统的强化学习算法难以有效复刻人类如何受过往经验影响而做决策,往往因过度简化而失效。 论文第一作者玛丽亚·克·埃克斯坦表示,以往研究常直接套用适用于 AI 的算法来解释人类行为,结果往往不尽如人意。为此,团队利用人工神经网络自动化了模型优化过程,将传统强化学习与灵活的神经网络结合,构建出能模拟人类记忆与心理过程的混合认知架构。通过收集大量人类在奖励学习任务中的决策数据,研究人员对比发现,包含人类心理特征的新模型在预测人类选择及解释行为机制方面,显著优于传统算法。 该研究不仅精确揭示了传统模型的不足,还展示了如何通过数学模型进行改进。这种混合建模方法突破了传统研究对样本量小(通常仅 20 至 50 人)和预设假设的局限。借助 AI,未来研究可轻松处理数百甚至上千人的数据集,并利用代码自动生成实验任务,让数据驱动假设,从而更敏锐地捕捉人类行为模式。 研究团队认为,这一进步有望为理解神经退行性疾病和情绪障碍提供新视角。由于这类疾病常伴有奖励学习过程的紊乱,更精准的 AI 模型将有助于深入解析其背后的认知过程与神经机制。埃克斯坦希望该模型能被广泛应用于临床研究,推动人工智能与行为科学的深度融合,为揭示人类决策的奥秘开辟新路径。
