HyperAIHyperAI

Command Palette

Search for a command to run...

Un modèle d’IA révolutionnaire identifie un million d’espèces : la zoologie numérique du futur débarque avec BioCLIP 2

Tanya Berger-Wolf, directrice de l’Institut de recherche en analyse translatable des données et professeure à l’Université d’État de l’Ohio, a lancé un projet révolutionnaire en biologie computationnelle, né d’un pari avec un collègue : créer un modèle d’intelligence artificielle capable d’identifier des zèbres plus vite qu’un zoologiste. Elle a remporté le pari. Aujourd’hui, elle mène une ambition bien plus vaste avec BioCLIP 2, un modèle fondamental en biologie entraîné sur le plus grand ensemble de données d’organismes jamais rassemblé. Ce modèle, présenté à la conférence NeurIPS 2024 à Mexico City et San Diego, représente une avancée majeure dans l’analyse des espèces et des écosystèmes. BioCLIP 2 va au-delà de l’identification d’images : il peut déduire des traits spécifiques, établir des relations intra- et interspécifiques, et même organiser des espèces selon des caractéristiques biologiques sans instruction explicite. Par exemple, il a classé les pinsons de Darwin selon la taille de leur bec, sans jamais avoir été informé du concept de « taille ». Cette capacité émergente découle d’un entraînement massif sur un ensemble de données exceptionnel : TREEOFLIFE-200M, comprenant 214 millions d’images couvrant plus de 925 000 catégories taxonomiques, allant des singes aux vers de farine et aux magnolias. Ce projet a été mené par l’Imageomics Institute en collaboration avec le Smithsonian Institution, des universités et d’autres organisations scientifiques. Après 10 jours d’entraînement sur 32 GPU NVIDIA H100, BioCLIP 2 a démontré des capacités inédites : distinguer les individus adultes des juvéniles, les mâles des femelles, et comprendre les hiérarchies taxonomiques (genre, famille, etc.) sans apprentissage supervisé. Il a aussi appris à reconnaître l’état de santé des plantes, en séparant les feuilles saines des feuilles malades, et même à différencier les types de maladies. Ces résultats sont rendus possibles grâce à une architecture d’apprentissage profond qui découvre des structures cachées dans les données. L’outil, disponible en open source sur Hugging Face, a été téléchargé plus de 45 000 fois en un mois, témoignant de son intérêt pour la communauté scientifique. Il s’inscrit dans la lignée du premier modèle BioCLIP, récompensé du prix du meilleur article étudiant à CVPR, et illustre l’importance de l’informatique accélérée par NVIDIA, essentielle à l’entraînement de tels modèles. L’objectif futur de Berger-Wolf est de développer des « jumeaux numériques » de la faune, des simulations interactives permettant d’explorer les interactions écologiques sans perturber les écosystèmes. Ces outils offriraient une plateforme pour tester des scénarios hypothétiques, observer le monde à travers le prisme d’une espèce (comme un zèbre ou une araignée), et révolutionner la recherche écologique. À terme, ces technologies pourraient être accessibles au grand public, notamment dans les zoos, pour une éducation environnementale immersive. « J’ai des frissons rien qu’en imaginant un enfant au zoo, voyant ce qu’un zèbre ou une araignée perçoit », confie Berger-Wolf, évoquant un avenir où l’intelligence artificielle devient un pont entre l’humain et la nature.

Liens associés

Un modèle d’IA révolutionnaire identifie un million d’espèces : la zoologie numérique du futur débarque avec BioCLIP 2 | Articles tendance | HyperAI