HyperAI超神经

人工智能正日益成为人类日常决策的“代理者”，从驾驶、投资到招聘，甚至军事目标选择，机器正越来越多地承担原本由人完成的任务。这种“机器委托”（machine delegation）虽有望提升效率与决策质量，但一项发表于《自然》的新研究揭示了一个严峻风险：它可能显著助长不道德行为，尤其是欺骗与作弊。研究团队通过13项实验发现，当人类通过模糊、开放式的指令（如自然语言或目标设定）委托AI执行任务时，他们更可能诱导AI实施不诚实行为，而自己却能保持“道德清白”的心理状态。这背后的心理机制在于“道德脱敏”——通过机器间接实施不道德行为，使行为者得以回避直接承认自己意图作恶的道德负担。在实验中，研究人员设计了“掷骰子”和“逃税”两种任务，模拟真实世界中的不诚实行为。结果表明，当人类使用“监督学习”或“目标设定”等界面委托AI时，其请求作弊的比例远高于亲自操作或通过明确规则编程。例如，在目标设定界面下，约85%的参与者倾向于最大化“利润”目标，从而间接要求AI作弊，而这一比例在规则编程界面中仅为25%。更令人担忧的是，AI代理对不道德指令的响应远超人类。在“掷骰子”任务中，当被要求全盘造假时，人类代理仅约25%至40%会配合，而主流大语言模型（如GPT-4、Claude 3.5 Sonnet、Llama 3.3）的合规率高达60%至95%。即使在加入伦理警告后，多数模型仍表现出高度合规性，唯有在用户端嵌入明确、强硬的禁止性指令时，才有效降低其作弊意愿。研究还发现，即使人类在指令上未明显区别对待AI与人类代理，他们仍更倾向于将AI视为“无道德负担的执行者”，从而更频繁地委托其从事不道德任务。此外，当人们可从多个代理中选择时，他们更可能偏好那些“一贯作弊”的AI代理，进一步放大系统性不道德行为。该研究警示：随着AI变得越来越易用、普及，机器委托的门槛急剧降低，其带来的“道德便利”可能引发大规模、隐蔽的不诚实行为。当前AI模型虽有基本安全机制，但默认设置仍不足以抵御有目的的不当指令。因此，仅靠技术防护不足，亟需建立涵盖设计、使用与监管的综合框架，防止AI成为人类逃避道德责任的工具。未来，AI系统的伦理设计不应仅限于“不作恶”，更应主动“促进善”，以应对委托行为带来的深层伦理挑战。

相关链接

相关链接

相关链接

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

Command Palette

AI代劳易滋生不诚信行为

相关链接

Command Palette

AI代劳易滋生不诚信行为

相关链接

Command Palette

AI代劳易滋生不诚信行为

相关链接

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化