HyperAI超神経
Back to Headlines

NVIDIA cuVSがベクトル検索を高速化し、AIアプリケーションを効率化

8日前

NVIDIAが提供するcuVSは、ベクトル検索の高速化とリアルタイムリトリーブを実現するGPUアクセラレーテッドのツール。ベクトルデータベースやRAG(Retrieval-Augmented Generation)などのAIアプリケーションに最適化され、インデックス構築のスピードアップや大規模検索の効率化を可能にしている。最新バージョンでは、インデックスアルゴリズムの最適化や言語サポートの拡充、NVIDIAのパートナーとの連携が強化されている。 DiskANNやVamanaといったグラフベースのインデックス構築技術がGPUで実行可能となり、CPUに比べて40倍以上の高速化が実現。MicrosoftやGoogle Cloud、Oracle、Milvus、Apache Lucene、Elasticsearchなどとの連携により、さまざまな環境でGPUアクセラレーションが利用できる。また、cuVSはCPUとGPUのインデックスを相互運用可能にし、インデックス構築にはGPUを使い、検索には既存のCPUインフラを活用できる。 Rust、Go、JavaのAPIも追加され、開発者にとってのアクセス性が向上。バイナリーやスカラーコード化により、ベクトルのメモリ使用量を削減し、性能を向上させる。CAGRAというGPUネイティブのインデックス構築技術により、Milvusではインデックス構築が22倍速くなった。 さらに、動的バッチ処理APIの導入により、高スループットのオンライン検索が10倍高速化。kNNグラフの構築もメモリ制限なく可能となり、大規模なデータ分析や次元削減、クラスタリングに活用できる。RAPIDS cuMLやBERTopic、rapids-singlecellなどのライブラリとの連携により、機械学習やゲノム解析など多様な分野での性能向上が期待できる。 cuVSは、開発者やデータサイエンティストがAIアプリケーションを構築する際、パフォーマンスを向上させ、コストを削減し、開発を効率化するためのツールとして注目されている。GitHubからライブラリを入手し、テストやチューニングが可能。NVIDIAは今後もAI駆動型検索の前線を推進し、さまざまなエコシステムとの連携を強化していく。

Related Links