HyperAI超神经

什么是AI中的情境工程？情境工程是一门新的学科，专注于设计、组织和操作输入到大型语言模型（LLMs）中的上下文，以优化模型的输出效果。与传统的微调模型权重或架构不同，情境工程更侧重于如何输入数据，包括提示、系统指令、检索得到的知识、格式以及信息的排列顺序。为什么需要情境工程？令牌效率：虽然LLMs的上下文窗口在不断扩大，但仍有限制，如GPT-4-Turbo的128K令牌限制。因此，高效的上下文管理变得至关重要，避免冗余或结构不良的上下文浪费宝贵的令牌。精确性和相关性：LLMs对噪声非常敏感。提示词越精准、逻辑结构越合理，模型的输出越准确。检索增强生成（RAG）：在RAG系统中，外部数据可以实时获取。情境工程帮助决定需要检索什么数据，如何分块以及如何呈现。代理工作流：在使用像LangChain或OpenAgents这样的工具时，自主代理依赖上下文来维持记忆、目标和工具使用。不良的上下文可能导致规划失败或产生错误信息。领域特定适应：微调模型成本高昂。通过构建更好的提示词或开发检索管道，使模型能够在特定领域以零样本或少样本学习的方式表现得更好。主要的情境工程技术系统提示优化：系统提示定义了LLM的行为和风格。通过优化系统提示，可以提升模型的整体性能。提示组合与链式处理：LangChain推广了提示模板和链式处理的概念，允许将任务分解成多个提示。例如，先分解问题，再检索证据，最后回答问题。上下文压缩：在有限的上下文窗口内，通过压缩减少冗余信息的占用。动态检索与路由：在RAG管道中，根据用户意图从向量存储中检索文档。高级设置可以实现多步检索和上下文传递。记忆工程：短期记忆（提示中包含的信息）和长期记忆（可检索的历史）需要对齐。技术包括维护上下文历史记录和动态更新记忆。工具增强上下文：在基于代理的系统中，工具的使用是上下文感知的。通过工具增强上下文，代理可以更好地执行特定任务。情境工程与提示工程的区别虽然两者密切相关，但情境工程的范围更广，更具系统性。提示工程通常涉及静态的手工制作输入字符串，而情境工程则包括使用嵌入、记忆、链式处理和检索等技术动态构建上下文。技术专家Simon Willison指出，“情境工程是我们不再进行微调的一种做法”。实际应用案例客户服务代理：向模型输入之前的工单摘要、客户资料和知识库文档，提高响应的个性化和准确性。代码助手：注入特定代码仓库的文档、之前的提交记录和函数用法，辅助开发者更高效地编写代码。法律文件搜索：根据案件历史和判例进行上下文感知查询，提高搜索的精确度。教育培训：开发拥有学习者行为和个人目标记忆的个性化辅导代理，提升教学效果。挑战与未来趋势尽管前景广阔，但在实施过程中仍面临一些挑战，包括如何优化上下文的动态构建、保持多步骤推理的一致性等。安德烈·卡帕奇在最近的一篇文章中提到，“上下文是新的权重更新”。未来的LLM应用中，上下文将成为核心的软件接口，情境工程的重要性不言而喻。总结随着LangChain、LlamaIndex等工具的成熟和代理工作流的普及，情境工程已成为解锁现代语言模型潜力的关键。无论是开发检索系统、代码辅助代理还是个性化辅导，如何结构化模型的上下文将越来越定义其智能化水平。业内人士评价及背景信息技术专家们普遍认为，情境工程的发展将极大推进LLM的实际应用。例如，安德烈·卡帕奇指出，未来的模型优化更多依赖于上下文的管理而非重新训练。这些观点进一步证实了情境工程在LLM领域的核心地位。背景方面，情境工程的崛起也反映了当前技术和行业对高效、低成本模型优化方案的需求。

上下文工程：优化AI语言模型性能的关键技术与应用

Related Links