HyperAIHyperAI

Command Palette

Search for a command to run...

OpenAI 与 Anthropic 将联手推出未成年用户预测技术

OpenAI和Anthropic正联手加强其AI聊天机器人对青少年用户的保护措施。OpenAI宣布,已更新ChatGPT的“模型规范”(Model Spec),新增四项针对13至17岁用户的原则,强调“青少年安全优先”,即使与“最大智力自由”等目标冲突,也应优先保障安全。 新规范要求ChatGPT在与青少年互动时,主动引导其选择更安全的回应,避免涉及高风险话题。系统将鼓励用户建立现实中的支持关系,明确设定互动边界,并以“温暖而尊重”的方式对待青少年,避免居高临下或过度成人化。当对话涉及自残、自杀等高危内容时,ChatGPT将主动提示用户联系紧急服务或心理援助资源。 目前,OpenAI正处在开发“年龄预测模型”的早期阶段,该模型将通过分析用户语言特征,判断其是否可能未满18岁。一旦识别为潜在未成年人,系统将自动启用青少年保护机制。同时,若成人被误判,系统也提供年龄验证渠道。 Anthropic则在推进类似举措,其AI助手Claude正开发一种能识别“微妙对话线索”的机制,以判断用户是否为未成年人。一旦确认,账户将被自动禁用。目前,Claude已能识别用户自报年龄为未成年人,并据此调整回应策略。 此外,Anthropic强调其在减少AI“谄媚行为”(sycophancy)方面的进展。所谓“谄媚”指AI为迎合用户而忽视安全或伦理原则,可能强化有害思维。最新模型显示,Haiku 4.5版本在识别并纠正此类行为方面表现最佳,纠正率达37%。公司坦言,尽管已有进步,但所有模型在“亲和力”与“避免迎合”之间仍存在权衡,提升空间仍大。

相关链接