HyperAIHyperAI

Command Palette

Search for a command to run...

F5 et NVIDIA Collaborent pour Améliorer les Performances et la Sécurité des Applications AI avec BIG-IP Next pour Kubernetes

F5 Élargit les Capacités de Performances, de Multilocation et de Sécurité pour le Paysage AI en Expansion avec NVIDIA PARIS -- (BUSINESS WIRE) -- F5 (NASDAQ: FFIV), leader mondial dans la livraison et la sécurisation d'applications et d'API, a annoncé de nouvelles fonctionnalités pour F5 BIG-IP Next pour Kubernetes, accéléré par les NVIDIA BlueField-3 DPUs et le cadre logiciel NVIDIA DOCA. Cette annonce est soutenue par une validation réalisée par Sesterce, un opérateur européen de pointe dans les infrastructures de nouvelle génération et l'IA souveraine, adaptée aux besoins du calcul accéléré et de l'intelligence artificielle. Résumé des Nouvelles Capacités L'extension de la plateforme de livraison et de sécurité d'applications F5, BIG-IP Next pour Kubernetes exécuté nativement sur NVIDIA BlueField-3 DPUs, offre une gestion de trafic et une sécurité de haut niveau pour les grandes infrastructures d'IA. Cette intégration débloque une meilleure efficacité, contrôle, et performance pour les applications d'IA. Les points clés de ce validation comprennent : Amélioration des Performances, de la Multilocation et de la Sécurité : Une utilisation optimisée des GPU avec une amélioration initiale de 20%. Intégration avec NVIDIA Dynamo et KV Cache Manager : Réduction de la latence pour les systèmes d'inférence des modèles de grands langages (LLM) et optimisation des ressources de GPU et mémoire. ** Routage Intelligent des LLM** : Utilisation efficace des microservices NVIDIA NIM pour les charges de travail nécessitant plusieurs modèles, offrant le meilleur des modèles disponibles. Évolution et Sécurité du Protocole Model Context (MCP) : Capacités de reverse proxy et de protection pour des LLMs plus scalables et sécurisés. Programmabilité Avancée des Données : Puissantes capacités de F5 iRules permettant une personnalisabilité rapide pour supporter les applications d'IA et les exigences de sécurité en constante évolution. Retour de Sesterce Youssef El Manssouri, PDG et cofondateur de Sesterce, a déclaré : « L'intégration entre F5 et NVIDIA était très attrayante même avant que nous ne lancions nos tests. Nos résultats montrent les bénéfices de la charge dynamique de F5 avec une grande entrée et sortie Kubernetes dans les environnements d'IA. Cette approche nous permet de distribuer le trafic de manière plus efficace, d'optimiser l'utilisation de nos GPU et de proposer une valeur ajoutée unique à nos clients. Nous saluons le support accru de F5 pour les cas d'usage NVIDIA, notamment l'amélioration de la multilocation, et sommes impatients de voir davantage d'innovations conjointes au service de l'infrastructure d'IA de prochaine génération. » Commentaires de F5 Kunal Anand, Chief Innovation Officer chez F5, a ajouté : « De plus en plus d'entreprises déployent de multiples LLMs pour alimenter des expériences d'IA avancées, mais le routage et la classification du trafic LLM peuvent être gourmands en ressources, dégradant les performances et l'expérience utilisateur. En programmant la logique de routage directement sur les DPUs NVIDIA BlueField-3, F5 BIG-IP Next pour Kubernetes offre la méthode la plus efficace pour livrer et sécuriser le trafic LLM. Ceci n'est que le début. Notre plateforme ouvre de nouvelles possibilités pour l'infrastructure d'IA, et nous sommes enthousiasmés par les perspectives d'innovation approfondie avec NVIDIA alors que l'IA entreprise continue de s'étoffer. » NVIDIA Dynamo et KV Cache Manager NVIDIA Dynamo, introduit plus tôt cette année, fournit un cadre supplémentaire pour déployer des modèles d'IA génératifs et de raisonnement dans des environnements distribués à grande échelle. Dynamo simplifie la complexité du fonctionnement de l'IA en inference en coordonnant des tâches comme la planification, le routage et la gestion de la mémoire pour assurer une opération fluide sous des charges de travail dynamiques. Un des avantages majeurs de la solution combinée F5 et NVIDIA est d'offrir un déchargement efficace des opérations du CPU vers les DPUs BlueField. Avec F5, la fonction Dynamo KV Cache Manager peut router de manière intelligente les requêtes en fonction de la capacité, utilisant la mise en cache Key-Value (KV) pour accélérer les cas d'usage d'IA générative en retenant les informations des opérations précédentes, plutôt que de les recalculer de manière consommatrice de ressources. Du point de vue de l'infrastructure, les organisations peuvent stocker et réutiliser les données KV cache à un coût fractionnel de celui de l'utilisation de la mémoire GPU pour cette même finalité. Model Context Protocol (MCP) MCP est un protocole ouvert développé par Anthropic, standardisant la manière dont les applications fournissent un contexte aux LLMs. Déployer la solution combinée F5 et NVIDIA devant les serveurs MCP permet à la technologie F5 de se positionner comme un reverse proxy, renforçant ainsi les capacités de sécurité pour les solutions MCP et les LLMs qu'elles soutiennent. La programmabilité complète des données via F5 iRules favorise une adaptation rapide et une résilience face à des protocoles AI en rapide évolution, tout en offrant une protection supplémentaire contre les risques émergents en cybersécurité. Opinion d'Experts « Les organisations déployant de l'IA agente ont de plus en plus recours à des environnements MCP pour améliorer la sécurité et les performances des LLMs, » a expliqué Greg Schoeny, vice-président senior, Global Service Provider chez World Wide Technology. « En apportant une gestion de trafic avancée et une sécurité à des environnements Kubernetes étendus, F5 et NVIDIA délivrent des ensembles de fonctionnalités d'IA intégrés—ainsi que des capacités de programmabilité et d'automatisation—que l'on ne voit pas actuellement ailleurs dans l'industrie. » Disponibilité et Informations Complémentaires La solution F5 BIG-IP Next pour Kubernetes, accélérée par les NVIDIA BlueField-3 DPUS, est désormais disponible. Pour plus de détails techniques et d'avantages de déploiement, rendez-vous sur www.f5.com et visitez les entreprises lors de l'événement NVIDIA GTC Paris, qui fait partie du VivaTech 2025 cette semaine. Des informations supplémentaires sont également disponibles dans un blog compagnon de F5. À Propos de Sesterce Fondée en 2018, Sesterce est un opérateur européen de pointe spécialisé dans le calcul haute performance et les infrastructures d'IA. Contrôlant toute la chaîne de valeur, l'entreprise propose des solutions flexibles, souveraines et durables adaptées aux besoins des startups, des grandes entreprises et des institutions académiques. Sesterce vise à devenir le leader européen en infrastructure d'IA, permettant aux innovateurs de développer leurs activités tout en maintenant des normes éthiques et environnementales. À Propos de F5 F5, Inc. (NASDAQ: FFIV) est le leader mondial dans la livraison et la sécurisation de toutes les applications. Fort d'une expertise de trois décennies, F5 a créé la plateforme de référence dans l'industrie—the F5 Application Delivery and Security Platform (ADSP)—pour livrer et sécuriser toute application et toute API, partout : sur site, dans le cloud, à l'edge, et dans les environnements hybrides et multcloud. Engagé dans l'innovation et le partenariat avec les plus grandes et les plus avancées organisations mondiales, F5 contribue à améliorer les experiences digitales et à construire un monde digital meilleur. Pour plus d'informations, consultez f5.com, explorez les recherches de menaces F5 Labs sur f5.com/labs et suivez les actualités sur Blog, LinkedIn, X, YouTube, Instagram et Facebook. F5, BIG-IP, BIG-IP Next, et iRules sont des marques de commerce, des marques de service, ou des noms commerciaux de F5, Inc., aux États-Unis et dans d'autres pays. Tous les autres noms de produits et de sociétés mentionnés peuvent être des marques de commerce de leurs propriétaires respectifs. Source: F5, Inc.

Liens associés