NVIDIA RAPIDS 25.08 : Nouveaux profilers, moteur Polars accéléré et algorithmes renforcés pour une science des données plus rapide
La version 25.08 de NVIDIA RAPIDS marque une avancée significative dans l’accélération des workflows de science des données, en offrant de nouvelles fonctionnalités visant à améliorer la performance, la scalabilité et la facilité d’utilisation. Parmi les nouveautés majeures, l’introduction de deux outils de profiling pour cuML permet aux utilisateurs d’analyser en détail l’exécution de leurs algorithmes d’apprentissage automatique. Le profiler par fonction affiche les opérations exécutées sur le GPU ou le CPU, ainsi que leur durée d’exécution, tant dans les notebooks Jupyter (via la cellule %%cuml.accel.profile) que depuis la ligne de commande (--profile). Un second profiler, au niveau des lignes de code, permet une analyse plus fine grâce à %%cuml.accel.line_profile ou à l’option --line-profile. Ces outils aident à identifier les goulets d’étranglement et à optimiser les performances sans modification du code. Le moteur GPU de Polars a également été considérablement amélioré. La nouvelle exécution en flux (streaming), désormais par défaut, permet de traiter des jeux de données bien plus volumineux que la mémoire GPU (VRAM) en utilisant un partitionnement efficace des données. Ce mode, déjà expérimental en 25.06, prend désormais en charge presque toutes les opérations du moteur en mémoire, offrant des gains de vitesse considérables — jusqu’à 5 fois plus rapide sur des jeux de données de 300 Go. Pour les données plus petites, la surcharge de performance est négligeable. Par ailleurs, le moteur GPU de Polars étend désormais son support aux structures (structs) dans les colonnes, permettant des opérations complexes comme value_counts sur des champs structurés directement sur GPU. L’ensemble des opérations sur les chaînes de caractères a également été élargi, renforçant la capacité du moteur à traiter des données tabulaires complexes sans basculer vers le CPU. En matière d’algorithmes, cuML ajoute désormais le modèle de Spectral Embedding, utilisé pour la réduction de dimensionnalité et l’apprentissage de variétés, avec une API compatible avec scikit-learn. Les algorithmes LinearSVC, LinearSVR et KernelRidge sont désormais accélérés via cuml.accel sans modification de code, complétant ainsi l’ensemble des modèles de machines à vecteurs de support. Cela simplifie grandement l’adoption de l’accélération GPU pour des utilisateurs familiers avec scikit-learn. Enfin, la version 25.08 déprécié le support de CUDA 11, qui n’est plus maintenu dans les conteneurs, paquets ou compilations sources. Les utilisateurs souhaitant continuer à utiliser CUDA 11 doivent se référer à la version 25.06. En somme, RAPIDS 25.08 renforce l’écosystème de science des données accélérée par GPU, en offrant des outils de diagnostic puissants, une meilleure scalabilité grâce au streaming, un support étendu des types de données et une plus grande couverture algorithmique. Ces évolutions rendent l’accélération GPU plus accessible, performante et intégrée dans les workflows existants. Pour en savoir plus, les utilisateurs sont invités à consulter la documentation, participer à la communauté Slack ou suivre les formations gratuites proposées par NVIDIA DLI.