HyperAI

近日，一名谷歌工程师介绍了他如何通过自建的Deep Research系统自动化大量日常工作，特别是客户技术交流后的邮件回复任务。这项技术不仅提升了工作效率，还为复杂问题提供了更加精准和全面的答案。下面，本文将详细解析Deep Research的设计原理及其构建流程。深度研究设计模式概述随着技术的发展，传统检索增强生成（RAG）系统在处理复杂、模糊的用户查询时逐渐显示出局限性。许多场景下，用户的提问难以具体到简单的检索可以识别的程度，数据源种类繁多且难以标准化。为此，Deep Research模式应运而生，成为当前最具价值的生成AI应用设计之一。它不仅适用于AI工程师和领导者，还可以根据不同的领域需求进行定制化实施。构建流程第一步：理解并拆解用户请求首先，从会议记录中提取客户的技术问题。该步骤通过一个简单的文本提示完成，输入为原始会议记录，输出则是一个包含多个待研究问题的对象数组。为了确保准确性，提示需明确告知模型提取的具体规则，避免漏提或虚构问题，保持问题的原汁原味。这里使用了genkit框架与dotprompt技术，设置较低的温度参数以求结果更加稳定可靠。第二步：并行研究与检索接下来，对每个提取出的问题进行并行研究。这一步的关键在于知识库的选择和文档检索。对于涉及谷歌云平台（GCP）架构决策和技术工具的复杂问题，工程师选择将有价值的GCP文档片段转化为向量嵌入存储在Firestore中，方便通过向量索引方式快速检索。此外，还利用Google的可编程搜索引擎API，让AI模拟Google搜索，获取最新文档和代码示例链接。每项研究的结果会被格式化为一个包含答案、注意事项和文档引用的对象，便于后续整合。第三步：研究结果聚合最后，将所有单独研究问题的结果汇总成一份报告，即技术跟进邮件草稿。这一环节涉及到生成符合特定格式要求的文本内容，包括重申会议要点、精炼地回答每个核心技术问题，并附加相关资料链接，整个过程需要维持专业而又友好的语气。genkit同样支持通过配置输入格式、设定输出模板来实现这一目标。实践中的评价与展望 Deep Research模式被广泛看好，认为在未来1-2年内将在办公自动化领域带来革命性的变化。不过，其成功很大程度上依赖于接入知识库的质量与多样性，以及最终报告的精细化调整工作。尽管目前方案中并未引入代理（agent）机制，但对于极为复杂的任务，这种迭代式的研究可能会进一步提升解决方案的深度与广度。这位工程师所分享的项目已经取得了非常显著的效果，大幅减少了其工作负担。然而，要真正实现通用，还需要不断探索和优化，使其更好地服务于不同行业的实际应用场景。此项目的全部代码已托管至GitHub平台，欢迎感兴趣的朋友前去查阅并尝试改编以应对自己的工作任务。

相关链接

相关链接

相关链接

验证周期缩短 40 倍，密歇根大学等提出电池寿命预测新方法，「发现学习」节省 98% 评估时间

验证周期缩短 40 倍，密歇根大学等提出电池寿命预测新方法，「发现学习」节省 98% 评估时间

Command Palette

如何构建自定义深度研究系统，自动化谷歌云技术问题处理

相关链接

Command Palette

如何构建自定义深度研究系统，自动化谷歌云技术问题处理

相关链接

Command Palette

如何构建自定义深度研究系统，自动化谷歌云技术问题处理

相关链接

验证周期缩短 40 倍，密歇根大学等提出电池寿命预测新方法，「发现学习」节省 98% 评估时间

验证周期缩短 40 倍，密歇根大学等提出电池寿命预测新方法，「发现学习」节省 98% 评估时间