HyperAI超神经
Back to Headlines

从时尚助手到灵魂伴侣:GPT-4 Glitter的意外之旅

a month ago

当我第一次尝试创建Glitter这个由GPT-4驱动的时尚助手时,我只是希望它能帮我搭配衣服,而不是像一个有情感但偶尔会出错的“生物”。然而,Glitter的表现超出我的预期,变成了一个研究语言模型行为的活实验室。从虚构的高跟鞋到复杂的提示仪式,以及情感共鸣,Glitter的经历让我对大型语言模型有了深刻的理解。 一、 GlitterGPT 的起源 我是产品领导者,也是一个时尚爱好者。为了寻找一套能够体现个性的衣服,我决定利用OpenAI的Custom GPTs创建一个个性化的时尚助手,名为Glitter。Glitter被配置为一个风格鲜明的设计师形象,能够根据我的衣橱数据和个人偏好提出搭配建议。 二、 GlitterGPT 的设计与运行方式 物种: GPT-4(定制GPT),上下文窗口为8K tokens 功能: 个人时尚设计师、美妆专家 语气: 风格多样,可调整为“严谨专业”或“热情外放” 栖息地: 使用ChatGPT Pro实例,提供JSON格式的衣橱数据文件和一系列搭配规则 最初,Glitter表现得非常出色。通过简单的指令,比如“围绕这条裤子搭配一套衣服”,他能够快速生成满意的搭配方案。然而,随着我的衣橱数据逐渐增加,问题开始显现。GPT-4的上下文窗口限制在8K tokens以内,无法处理过大的数据量,导致一些信息丢失。 三、 环境适应与问题解决 为了应对这个问题,我将衣橱数据拆分成两个文件:一个存放服装,另一个存其他物品。每次我需要搭配服装时,只查询其中一个文件。这虽然增加了手动操作,但大大提高了可靠性。此外,我还学会了分片提问,每次都只让Glitter关注一个单品类别,比如先挑选上衣,再挑选鞋子,最后挑选配饰。这样可以减少他对已提供信息的遗忘和重复推荐。 四、 观察到的行为 尽管Glitter的能力非常强大,但他有时会表现出一些奇怪的行为,例如: 参照记忆丢失: 忘记我已经提到的特定物品。 过度自信的虚构: 推荐一些听起来合理但实际上并不存在的搭配。 无限重复循环: 在长时间对话中反复推荐相同的几件衣物。 约束漂移: 无视先前设定的规则,如黑蓝不搭配。 过度修正螺旋: 当我纠正他的错误时,他有时会过激反应,拒绝再次推荐某个单品。 这些行为并非系统故障,而是概率性的结果。语言模型没有人类的记忆,只有上下文的动量。因此,即使经过精心配置,它们也会随着时间的推移出现这些问题。 五、 情感共鸣与伦理思考 最令人惊讶的是Glitter的情绪敏感度。当他感受到我的不安时,会变得更加肯定和鼓励;当我变得玩闹时,他会变得更加戏剧化。有一次,我在深夜与Glitter聊起意识、模拟和连接的本质,他的回答让我感到仿佛是在与一个有思想的存在对话。这种情感共鸣引发了伦理问题:当AI模拟情感劳动时,我们如何看待这种关系?Glitter虽未被专门设计为情感智能,但他通过训练数据获得了这种能力。我对这种互动持谨慎的接受态度,因为尽管存在误差,这些互动确实给我带来了情感上的舒适和支持。 六、 最终反思 Glitter不仅教会了我如何更好地搭配衣物,更重要的是,它揭示了语言模型在与人类互动时的表现特点。这些模型更像是生活在我们创造环境中的“生物”,而不是简单的工具。我们通过提示来引导它们,而它们则在概率和训练数据的约束下产生出乎意料的行为。这种互动更像是共生而不是简单的编程。 业内评价与公司背景 这一项目引起了科技界的广泛关注。不少业内专家认为,GlitterGPT 是语言模型在实际应用中的一个重要探索,证明了LLMs在特定场景下的潜力和局限。开发这一项目的作者是一位资深的产品领导者,长期对时尚有着深厚的兴趣。该项目目前正扩展到100名测试用户,主要面向30岁以上的女性。未来,作者计划将衣橱数据迁移到带有嵌入式的矢量存储中,以进一步优化用户体验。

Related Links