HyperAI超神经

Par Super Neuro

Contenu en un coup d'œil :Le 21 mars à 23h00, heure de Pékin, le fondateur et PDG de NVIDIA, Jensen Huang, a prononcé un discours d'ouverture au GTC 2023, présentant les derniers développements en matière d'IA générative, de métaverse, de grands modèles de langage, de cloud computing et d'autres domaines.

Mots-clés:NVIDIA Jen-Hsun Huang GTC 2023

« Ne manquez pas ce moment décisif de l'IA », ce qui signifie « Ne manquez pas le moment décisif de l'IA » en chinois. Le 21 mars 2023 à 23h00, heure de Pékin, Huang Xiaoming, « l'épéiste en cuir », a prononcé un discours liminaire sur le même thème au GTC 2023 et a déclaré : « Ce sera notre GTC le plus important à ce jour. »Le compte Twitter officiel de NVIDIA a également publié le Top 5 AI Wave du GTC de cette année. Quelle est la vérité ? Jetons un œil aux principales annonces de la Keynote de cette année.Modifier l'image de recherche

Top 5 des vagues de l'IA

Mot-clé 1 : IA générative

La technologie d'IA générative fournit les modèles et structures de base des données d'apprentissage pour générer de nouveaux contenus, tels que des images, de l'audio, du code, du texte, des modèles 3D, etc. Les outils d'IA générative professionnels peuvent augmenter la productivité des créateurs et profiter aux utilisateurs qui sont moins familiers avec la technologie. Le service cloud NVIDIA AI Foundations et NVIDIA Piccasso ont été annoncés lors de la GTC 2023.

La technologie de l’IA révolutionne la création de contenu 3D. Au GTC 2023,Jensen Huang a annoncé l'arrivée d'une nouvelle version de l'application Omniverse Audio2Face dans le domaine de l'IA générative.

Modifier l'image de recherche Effet Omniverse Audio2Face

Omniverse Audio2Face utilise l'intelligence artificielle pour permettre aux artistes 3D de créer rapidement des animations faciales réalistes à partir de fichiers audio, évitant ainsi le processus manuel généralement long et laborieux. Audio2Face propose désormais un aperçu de la prise en charge du chinois mandarin, ainsi qu'une qualité de synchronisation labiale améliorée, une prise en charge multilingue plus robuste et de nouveaux modèles pré-entraînés.

Lancement de la première génération de système de supercalcul génératif d'IA pour l'industrie pharmaceutique

Le groupe japonais Mitsui & Co. a annoncé la création de Tokyo-1, un système de supercalcul basé sur NVIDIA DGX. Tokyo-1 est le premier système de supercalcul d'IA générative au monde pour l'industrie pharmaceutique et sera utilisé pour explorer les simulations de dynamique moléculaire et les modèles d'IA générative.Le projet devrait être mis en service au cours du second semestre 2023 et sera exploité par Xeureka, une filiale de Mitsui & Co. Xeureka espère utiliser Tokyo-1 pour résoudre les problèmes de longue date liés au retard de développement des médicaments dans l'industrie pharmaceutique japonaise.

Tokyo-1 est basé sur NVIDIA DGX H100, et la première phase comprend 16 systèmes NVIDIA DGX H100, chacun équipé de 8 GPU NVIDIA H100 Tensor Core. Xeureka continuera d'étendre l'échelle du système et de fournir des capacités de connexion de nœuds aux clients de l'industrie japonaise, notamment la simulation de dynamique moléculaire, la formation de modèles de langage à grande échelle, la chimie quantique et la génération d'IA de structures moléculaires pour des innovations médicamenteuses potentielles. Dans le même temps, les utilisateurs de Tokyo-1 pourront également fournir des services et des découvertes de médicaments via NVIDIA BioNeMo.

Mot-clé 2 : Biologie numérique

NVIDIA a publié un ensemble de services cloud d'IA générative permettant de personnaliser les modèles basés sur l'IA afin d'accélérer la recherche dans des domaines tels que les protéines et la thérapeutique, la génomique, la chimie, la biologie et la dynamique moléculaire.

Les modèles d’IA génératifs peuvent identifier rapidement des molécules médicamenteuses potentielles et, dans certains cas, concevoir des composés chimiques ou des thérapies à base de protéines à partir de zéro. Formés sur de grands ensembles de données de petites molécules, de protéines, de séquences d'ADN et d'ARN, ces modèles peuvent prédire la structure tridimensionnelle d'une protéine et la façon dont une molécule s'arrime à une protéine cible.Modifier l'image de recherche

Le nouveau service cloud BioNeMo™ accélère le développement de médicaments pour la formation et l'inférence de modèles d'IA.Il permet aux chercheurs d'affiner les applications d'IA génératives sur leurs propres données et d'exécuter l'inférence du modèle d'IA directement dans le navigateur ou de s'intégrer facilement dans les applications existantes via de nouvelles API cloud.

Les services cloud de BioNeMo incluent des modèles d'IA pré-entraînés qui aident les chercheurs à créer des pipelines d'IA pour le développement de médicaments et sont actuellement utilisés pour la conception de médicaments par des sociétés biopharmaceutiques telles qu'Evozyne et Insilico Medicine.

Les nouveaux modèles d'IA génératifs connectés aux services BioNeMo incluent :

* Modèle de chimie générative MegaMolBART

* Modèle de langage protéique ESM1nv

* Modèle de prédiction de la structure des protéines OpenFold

* Modèle de prédiction de la structure de la protéine AlphaFold2

* DiffDock Modèle de génération de diffusion pour l'amarrage moléculaire

* Modèle de prédiction de la structure des protéines ESMFold

* Modèle de langage protéique ESM2

* Modèle de chimie générative MoFlow

* ProtGPT-2 Un modèle de langage pour générer de nouvelles séquences de protéines

Mot-clé 3 : CV

CV-CUDA est une bibliothèque d'accélération GPU open source pour la vision par ordinateur basée sur le cloud, conçue pour aider les entreprises à créer et à faire évoluer des pipelines de vision par ordinateur et de traitement d'images basés sur l'IA de bout en bout sur les GPU.Modifier l'image de recherche

Le moteur de recherche visuel Bing de Microsoft utilise l'IA et la vision par ordinateur pour rechercher des images sur le Web

(L'image montre la nourriture pour chien dans l'image de recherche)

CV-CUDA décharge les étapes de prétraitement et de post-traitement du CPU vers le GPU, traitant quatre fois plus de flux sur un seul GPU pour la même charge de travail à un quart du coût du cloud computing.

La bibliothèque CV-CUDA fournit aux développeurs plus de 30 algorithmes de vision par ordinateur hautes performances.Inclut des API Python natives et une intégration sans copie avec des frameworks d'apprentissage automatique tels que PyTorch, TensorFlow2, ONNX et TensorRT, offrant un débit plus élevé, des coûts de calcul inférieurs et une empreinte carbone plus faible que les services d'IA cloud.

Depuis la sortie de la version alpha de CV-CUDA, plus de 500 entreprises ont créé plus de 100 cas d'utilisation.

Mot-clé 4 : Machines autonomes

En 2021, NVIDIA a proposé cuOpt, un logiciel d'optimisation d'itinéraire en temps réel qui offre aux entreprises la possibilité de s'adapter aux données en temps réel. cuOpt optimise les itinéraires de livraison en analysant des milliards de mouvements possibles par seconde.

cuOpt est désormais le centre d'un écosystème de partenaires florissant qui comprend des intégrateurs de systèmes et des fournisseurs de services, des fournisseurs de logiciels de logistique et de transport, des experts en logiciels d'optimisation et des fournisseurs de services de localisation. cuOpt a établi trois records dans le cadre du benchmark Li & Lim de ramassage et de livraison, un ensemble de benchmarks proposés par Li et Lim pour mesurer l'efficacité des itinéraires.

Modifier l'image de recherche

Pour le benchmark Li & Lim, les chercheurs ont tracé le meilleur itinéraire il y a deux décennies, inventé des algorithmes pour définir et réinitialiser les solutions les plus célèbres au monde, et les gagnants précédents se sont concentrés sur de petits ajustements aux itinéraires précédents. L'itinéraire créé par cuOpt est différent de ceux créés par les gagnants précédents. cuOpt offre une amélioration de 7,2x par rapport à l'amélioration précédemment enregistrée sur le benchmark et une amélioration de 26,6x par rapport au résultat de pointe précédent.

Mot-clé 5 : IA conversationnelle

Les entreprises de tous les secteurs cherchent à tirer parti des avatars interactifs pour améliorer les expériences numériques. Mais leur création est un processus complexe et long qui nécessite l’application de modèles d’intelligence artificielle avancés capables de voir, d’entendre, de comprendre et de communiquer avec les utilisateurs.Modifier l'image de recherche

Pour simplifier ce processus,NVIDIA fournit aux développeurs des solutions d'intelligence artificielle en temps réel via Omniverse Avatar Cloud Engine (ACE).Il s'agit d'une suite de microservices cloud native pour le développement de bout en bout d'avatars interactifs. NVIDIA s'améliore constamment et fournit aux utilisateurs les outils dont ils ont besoin.Concevez et déployez facilement une variété d'avatars, des chatbots interactifs aux humains numériques intelligents.

AT&T prévoit d'utiliser les flux de travail d'avatar Omniverse ACE et Tokkio AI pour créer, personnaliser et déployer des assistants virtuels pour le service client et les services d'assistance aux employés. AT&T, en collaboration avec Quantiphi, l'un des partenaires de prestation de services de Nvidia, développe des avatars interactifs capables de fournir une assistance 24h/24 et 7j/7 dans toutes les régions, dans les langues locales. Cela aide l’entreprise à réduire ses coûts tout en offrant une meilleure expérience à ses employés du monde entier. En plus du service client, AT&T prévoit également de créer et de développer des humains numériques pour divers cas d'utilisation dans l'ensemble de l'entreprise.

En plus des cinq mots clés ci-dessus tout au long du discours d'ouverture, il y a également d'autres choses qui méritent d'être notées au GTC 2023 :« Ventes en ligne » de Huang Renxun Grace Superchip Superchip.

Grace CPU : ouvrir la voie aux économies d'énergie

Lors de tests réels, le Grace CPU Superchip a des performances 2 fois supérieures à celles du processeur x86 lorsque l'enveloppe des principales applications CPU du centre de données est la même, ce qui signifie que le centre de données peut gérer 2 fois le trafic de pointe ou réduire de moitié les coûts d'électricité.

Trois innovations majeures en matière de processeurs :

* Dans une seule matrice, le processeur Grace connecte 72 cœurs Arm Neoverse V2 avec une structure ultra-rapide, offrant une bande passante de 3,2 To/s, un débit standard.

* Connexion de deux puces dans un package superchip à l'aide de l'interconnexion NVIDIA NVLink-C2C, fournissant 900 Go/s de bande passante.

* Grace CPU est le premier processeur de centre de données à utiliser la mémoire LPDDR5X de qualité serveur. Cela fournit jusqu'à 50% de bande passante mémoire à un coût similaire et 1/8 de la puissance de la mémoire de serveur typique, dans une taille compacte et 2 fois la densité des conceptions de mémoire basées sur des cartes typiques.Modifier l'image de recherche

Le spectacle en direct de Lao Huang Grace Superchip

Le test a révélé queComparé aux principaux processeurs x86 du centre de données utilisant la même consommation d'énergie, le processeur Grace :

* Les microservices sont 2,3 fois plus rapides ;

* Vitesse de traitement des données gourmandes en mémoire augmentée de 2 fois ;

* La dynamique des fluides numérique est désormais 1,9 fois plus rapide.

NVIDIA : le moteur du monde de l'IA

Depuis la fin de l’année dernière, ChatGPT a mis l’IA générative et les grands modèles linguistiques au premier plan. Selon Huang Renxun, ChatGPT a ouvert une nouvelle ère. Le « moment iPhone » de l'IA, mais dans le discours d'aujourd'hui diffusé en direct, il a également admis « Les capacités impressionnantes de l’IA générative ont créé un sentiment d’urgence pour les entreprises de repenser leurs produits et leurs modèles commerciaux. »On peut constater que NVIDIA a commencé à réaliser des percées multidimensionnelles, de la formation à l’IA au déploiement, des semi-conducteurs aux bibliothèques de logiciels, des systèmes aux services cloud, etc.

Actuellement, l’écosystème mondial NVIDIA comprend 4 millions de développeurs, 40 000 entreprises et 14 000 startups dans NVIDIA Inception.Comme l'a déclaré Huang Renxun dans une interview accordée à CNBS à la veille du GTC 2023, NVIDIA veut devenir une telle entreprise :

Grâce à ce que nous faisons, nous pourrions rendre possible ce qui est à peine possible, ou nous pourrions fabriquer quelque chose qui consomme beaucoup d’énergie, mais qui est très économe en énergie, ou nous pourrions transformer quelque chose qui génère beaucoup d’argent et le rendre plus abordable.

-- sur--

GTC 2023 | Huang Renxun, « Leather Swordsman », Parle Du Top 5 De L'ia, De L'informatique Scientifique, De L'ia Générative Et D'omnivers Qui Figurent Sur La Liste