Nemotron 3.5 : Sécurité IA
NVIDIA lance Nemotron 3.5 Content Safety, une mise à jour majeure de sa solution de modération par intelligence artificielle. Cette version complète l'architecture initiale lancée en mars 2026 en unifiant plusieurs capacités dans un seul modèle de quatre milliards de paramètres. Le système adopte désormais une évaluation multimodale intégrée. Il analyse simultanément le texte, une image facultative et la réponse générée, permettant de détecter les risques qui n'apparaissent qu'à l'intersection de ces éléments. Cette approche remplace les vérifications séquentielles précédentes et ferme une faille courante dans la sécurité des contenus hybrides. La couverture linguistique s'élargit considérablement. Le modèle est entraîné sur douze langues, dont le français, l'anglais et le chinois, tout en bénéficiant d'une adaptation automatique sur environ cent quarante autres langues grâce à son architecture de base. Cette polyvalence facilite le déploiement dans des marchés aux données d'entraînement limitées sans nécessiter de réentrainement local. Une innovation centrale concerne l'application de politiques de sécurité personnalisées. Les entreprises peuvent soumettre des règles spécifiques au modèle, qui les intègre directement lors de l'évaluation. Cette flexibilité s'accompagne d'un mode de raisonnement auditable. Le modèle peut alors exposer une chaîne de pensée concise en quelques phrases avant de délivrer son verdict. Cette traçabilité répond aux exigences de conformité des secteurs régulés, tout en restant désactivable pour des traitements en temps réel plus rapides. Bâti sur une architecture optimisée, Nemotron 3.5 s'exécute sur des cartes graphiques dotées de huit gigaoctets de mémoire vidéo. NVIDIA publie également le jeu de données d'entraînement associé, qui se distingue par l'utilisation de photographies réelles pour près de 99 % des images, corrigeant ainsi un biais récurrent dans les benchmarks multimodaux. Les évaluations sur des benchmarks internationaux placent le modèle à une précision moyenne de 85 %. Il affiche 96,5 % sur la norme Multilingual Aegis et 88,8 % sur RTP-LX. Sa conception compacte garantit des temps d'inférence réduits, comparables à la génération précédente et inférieurs à ceux de certains concurrents raisonnants. Le modèle est disponible sur Hugging Face sous licence ouverte pour la recherche et l'usage commercial. Il est intégré aux microservices GPU NVIDIA NIM et accessible via plusieurs plateformes d'inférence. NVIDIA fournit par ailleurs des outils assistés pour aider les développeurs à générer et intégrer leurs propres politiques de sécurité.
