
要約
近似最近傍探索(ANNS)アルゴリズムは、最近のAI応用においてますます重要性を増しており、とりわけ検索拡張生成(RAG)やエージェントベースのLLMアプリケーションにおいて顕著である。本論文では、ANNSアルゴリズムのための新しいパラダイムであるCRINNを提案する。CRINNは、ANNS最適化を強化学習の問題として捉え、実行速度を報酬信号として用いる。このアプローチにより、精度制約を維持しつつ、段階的に高速化されたANNS実装の自動生成が可能となる。実験評価の結果、CRINNは6つの広く用いられているNNSベンチマークデータセットにおいて有効性を示した。最先端のオープンソースANNSアルゴリズムと比較したところ、GIST-960-Euclidean、MNIST-784-Euclidean、GloVe-25-angularの3つのデータセットで最高性能を達成し、SIFT-128-EuclideanおよびGloVe-25-angularの2つのデータセットでは並びで首位を獲得した。CRINNの成功は、ANNS最適化の範囲をはるかに超える意義を持つ。それは、強化学習を組み込んだLLMが、専門的な知識と手作業による高度な微調整を要する複雑なアルゴリズム最適化を自動化する有効なツールとして機能しうることを実証している。コードは https://github.com/deepreinforce-ai/CRINN で公開されている。