HyperAI

谷歌推出全新文件搜索工具，旨在彻底简化企业级检索增强生成（RAG）应用的开发流程。传统RAG系统需要手动完成数据分块、向量化、存储和查询等复杂步骤，而谷歌的File Search工具将整个流程封装为一个内置在Gemini API中的“工具”，开发者仅需几行代码即可实现基于私有文档的智能问答。该工具的核心是基于gemini-embedding-001模型的向量搜索能力，能理解查询的语义，即使用户用不同措辞提问，也能精准定位相关文档内容。与传统关键词搜索不同，它能捕捉上下文含义，提升检索准确率。所有返回结果均附带可验证的引用信息，明确标注答案来源的文档和段落，增强企业级AI应用的可信度。 File Search支持多种常见文件格式，包括PDF、DOCX、TXT、JSON及各类代码文件，无需预处理即可直接上传使用。在成本方面，文件存储和查询嵌入完全免费，仅对原始文档内容的嵌入收费，价格低至每百万token 0.15美元，极具性价比。使用上，开发者只需创建一个文件搜索存储（file search store），上传文件并等待处理完成，随后在调用Gemini模型时，通过工具配置启用File Search，即可让模型基于上传文档生成回答。示例代码展示了如何从一份180页的三星S25用户手册中准确提取支持的机型信息，甚至能回答“如何设置自动熄屏”这类具体操作问题，且结果与原文完全一致。该工具还支持多文件批量上传，通过循环操作即可完成。用户可自定义分块策略，如设置每块最大200个token，块间重叠20个token，以适应不同文档结构。与谷歌其他类似工具相比，File Search是唯一真正实现持久化向量存储的RAG产品——嵌入数据长期保留，无需重复上传，而Context Grounding和LangExtract则不具备此能力。此外，系统在48小时后自动删除原始文件，但保留向量索引，用户可随时通过API删除整个存储以控制成本。总体而言，File Search将复杂的RAG工程抽象为一个轻量、高效、可扩展的API调用，大幅降低AI应用开发门槛，是企业构建私有知识库的有力工具。

相关链接

相关链接

相关链接

ICLR 2026 丨单任务可训练参数减少 125 倍！新方法 Task Tokens 助力具身智能提升复杂任务能力

ICLR 2026 丨单任务可训练参数减少 125 倍！新方法 Task Tokens 助力具身智能提升复杂任务能力

Command Palette

谷歌文件搜索工具：快速定位文档的智能利器

相关链接

Command Palette

谷歌文件搜索工具：快速定位文档的智能利器

相关链接

Command Palette

谷歌文件搜索工具：快速定位文档的智能利器

相关链接

ICLR 2026 丨单任务可训练参数减少 125 倍！新方法 Task Tokens 助力具身智能提升复杂任务能力

ICLR 2026 丨单任务可训练参数减少 125 倍！新方法 Task Tokens 助力具身智能提升复杂任务能力