NVIDIA cuVS优化向量搜索 实现实时高效索引
NVIDIA 推出最新版本的 cuVS,强化了向量搜索能力,助力开发者和数据科学家提升 AI 应用的性能。该工具通过 GPU 加速,实现更快的索引构建、实时更新和大规模搜索,适用于检索增强生成(RAG)、推荐系统、数据分析和异常检测等场景。 此次更新引入了优化的索引算法、更多语言支持,并与 Meta FAISS、Google Cloud AlloyDB、Vertex AI、Milvus、Apache Lucene、Elasticsearch、OpenSearch、Weaviate、Kinetica 等平台深度集成。cuVS 支持在 GPU 上构建索引,相比 CPU 可提升 40 倍速度,尤其在 DiskANN 和 Vamana 算法上表现突出。 为提升系统效率,cuVS 还支持 GPU 与 CPU 之间的索引兼容,用户可利用 GPU 快速构建索引,再通过 CPU 进行搜索,从而兼顾性能与成本。例如,cuVS 可在 GPU 上快速构建 CAGRA 图,再转换为 HNSW 格式供 CPU 使用。 此外,cuVS 新增了 Rust、Go 和 Java 接口,使更多开发者可以轻松接入。它还支持二进制和标量量化,分别将向量存储缩小 4 倍和 32 倍,并提升性能 4 倍和 20 倍。 在高吞吐搜索方面,cuVS 推出动态批处理 API,可将 GPU 上的搜索延迟降低 10 倍,同时在交易和广告系统等高并发场景中提升 8 倍吞吐量。其 CAGRA 持久化搜索功能也增强了实时数据分析能力。 NVIDIA 表示,cuVS 正在重新定义 GPU 加速的向量搜索,通过优化性能、降低成本和简化 AI 应用开发,帮助组织高效处理大规模搜索任务。开发者可通过 GitHub 获取 cuVS,并使用 cuVS Bench 工具在 GPU 和 CPU 环境中进行性能对比。该工具既可独立使用,也可通过 FAISS、Milvus 等平台集成,未来将有更多更新推出。