Back to Headlines

NVIDIA RAPIDS 25.08、cuMLプロファイラー搭載でMLワークロードの最適化を強化

4日前

NVIDIAのデータ科学加速プラットフォーム「RAPIDS」の最新バージョン25.08がリリースされ、AIや機械学習におけるGPU加速の効率性とスケーラビリティが大幅に向上した。主な新機能として、cuML向けの新プロファイラーやPolars GPUエンジンの強化、新アルゴリズムの追加が行われた。 まず、cuMLのゼロコード変更加速機能に、関数レベルと行レベルのプロファイリングツールが追加された。Jupyterノートブックでは%%cuml.accel.profileや%%cuml.accel.line_profileを実行することで、コードのどの部分がGPUで実行され、どの部分がCPUにfallbackしたかを詳細に可視化できる。CLIからも--profileや--line-profileオプションで同様の分析が可能。これにより、開発者はAIモデルの実行速度のボトルネックを特定し、最適化を進めやすくなった。 次に、Polars GPUエンジンでは、25.06で実験的導入された「ストリーミング実行モード」がデフォルト化された。この機能により、GPUメモリ(VRAM)を超える大規模データセットも効率的に処理可能。特に300GBを超えるデータに対しては、従来のインメモリエンジンと比べて最大5倍の高速化が実現。また、構造体(struct)データや文字列操作のサポートが拡張され、CPUにfallbackするケースが大幅に削減された。これにより、より複雑なデータ処理もGPU上で完結できるようになった。 cuMLでは、次元削減に使える「スペクトル埋め込み(Spectral Embedding)」アルゴリズムが新たに追加。さらに、LinearSVC、LinearSVR、KernelRidgeといった機械学習アルゴリズムもゼロコード変更でGPU加速が可能になり、SVM系全アルゴリズムがカバーされた。 一方で、CUDA 11のサポートは終了。25.08以降はCUDA 12以降のみを対象とする。CUDA 11を使い続けたい場合は、25.06バージョンに固定する必要がある。 このリリースにより、RAPIDSはデータサイエンスのワークフローをより高速かつスケーラブルに実現するツールとしての位置を強化。開発者はGPUを活用した効率的な分析を、より簡単に実現できるようになった。

Related Links