HyperAI超神经
Back to Headlines

大型语言模型:超越拟人化,探索其真实潜力与挑战

2 days ago

大型语言模型(LLM)是一种人工智能系统,通过将单词或标记映射到高维向量空间中的点来生成文本。当用户输入一段文字时,LLM会基于这段文字的路径计算下一个词出现的概率,并根据这些概率随机选择下一个词。这可以想象为在高维度空间中玩“蛇”游戏,路径不断向前延伸,超过最大上下文长度的部分则被截断。从技术角度来看,一个初始化后的LLM其实是一个从((\mathbb{R}^n)^c)到((\mathbb{R}^n)^c)的映射函数,其中(c)是上下文长度,(n)是向量的维度。 为了训练这一映射函数,研究者们使用了大量的文本数据,包括人类撰写的文本、特定领域的专家文档,以及部分自动生成的文本。通过这些数据,LLM学习到了如何生成类似人类的文字序列。生成的路径呈现出复杂而曲折的特性,类似于混沌动力学系统中的奇异吸引子,有其内在的结构但又无法完全预测。 尽管LLM的能力迅速提高,能够解决越来越多的问题,但对于某些研究人员来说,将它们描述为具有意识、道德观念或其他人性特征的行为体是不恰当的。LLM本质上是一种数学工具,它根据已有的输入生成新的文本片段,与人的思维方式存在根本差异。例如,人们可能会担心LLM会产生有害的文本序列,但在现实操作中,这只是因为概率计算中没有充分排除有害结果,而不是因为LLM本身有所谓的“恶意”或目标。 历史上,人类常常将一些不可预测的随机事件归结于神的愤怒或恶灵作祟。如今,当研究人员用类似的方式讨论LLM时,这种人为拟人的做法会使人工智能技术显得更加神秘和恐怖,从而影响公众对这项技术的理解和接受。部分AI领域的知名人士之所以倾向于拟人化LLM,可能是因为他们内心希望自己的研究能够达到创建AGI的目标,即创造一种与人类相当甚至超越人类的智能生命。但对于本文作者而言,这种期望过于理想化,甚至可以说是一种误读。相比之下,作者认为当前技术的实际应用已经足够引人关注,即使我们永远达不到AGI的水平,仅靠现有的LLM也能带来显著的变化,其影响可能不亚于电气化的进程。`

Related Links