HyperAIHyperAI
Back to Headlines

PollenGEO : une base de données digitale de 40 millions d’images pour révolutionner l’identification du pollen

il y a 19 jours

Une équipe du Smithsonian Tropical Research Institute (STRI) travaille à la numérisation d’images de pollen provenant de plus de 18 000 espèces végétales tropicales, dans le cadre du projet PollenGEO. Ces données, publiées dans la revue PLANTS, PEOPLE, PLANET, constituent l’une des plus grandes bases de référence de pollen au monde, hébergée au STRI et au Musée national d’histoire naturelle du Smithsonian. Le projet vise à transformer la manière dont le pollen est identifié, en remplaçant des heures de microscopie manuelle par des modèles d’intelligence artificielle entraînés sur plus de 40 millions d’images numérisées. Le pollen, extrêmement durable, peut survivre des centaines de millions d’années, offrant ainsi des indices précieux sur l’évolution des écosystèmes, le climat passé et la biodiversité ancienne. Chaque espèce végétale produit un pollen unique, ce qui en fait un outil puissant pour des analyses scientifiques variées : diagnostic des allergies, enquêtes criminelles (traçage de l’origine de tissus), étude des forêts anciennes ou datation des gisements pétroliers. En milieu tropical, où la diversité végétale est immense et où de nombreuses espèces restent non décrites, l’identification manuelle est particulièrement complexe, d’autant plus lorsqu’il s’agit de pollen fossile de plantes aujourd’hui éteintes. Le projet PollenGEO repose sur plusieurs collections majeures, notamment la collection palynologique Graham, offerte au STRI en 2008 et contenant environ 18 000 espèces de pollen tropical sur plus de 23 000 diapositives, chacune accompagnée d’un carton d’index. Plus de 100 bénévoles du Smithsonian Transcription Center ont contribué à la saisie des données. D’autres collections, comme celles de Joan Nowicke, de Dave Roubik et Enrique Moreno (île de Barro Colorado), de Paul Collinvaux (Amazonie) ou de Sian Ka’an (Mexique), ont également été intégrées, ainsi que près de 1 000 échantillons fossiles du Musée national d’histoire naturelle. Pour entraîner un modèle d’intelligence artificielle capable d’identifier automatiquement les grains de pollen, une collaboration interdisciplinaire a été menée, impliquant des spécialistes de la botanique, de l’informatique et de l’analyse d’image. L’associée professor Surangi Punyasena de l’Université d’Illinois à Urbana-Champaign est à l’origine de l’environnement logiciel de l’IA. Ce système permettra d’accélérer considérablement les analyses palynologiques, notamment dans le cadre du projet Trans-Amazon Drilling, qui utilise des carottes de forage pour reconstituer l’histoire de la forêt amazonienne à l’aide du pollen. La base de données PollenGEO sera mise gratuitement en ligne, transformant l’identification du pollen d’une tâche isolée derrière un microscope en un processus numérique, collaboratif et accessible à tous. Un webinaire présenté par Andrés Díaz en espagnol a déjà illustré le processus de numérisation de ces 40 millions d’images. Ce projet représente une avancée majeure pour la palynologie, la paléoclimatologie et de nombreuses autres disciplines scientifiques. En évaluation, les experts saluent la portée du projet : selon Carlos Jaramillo, le projet ouvre la voie à une « révolution numérique dans la palynologie ». L’accessibilité mondiale de ces données devrait favoriser la recherche, la formation et la conservation de la biodiversité, tout en permettant des analyses plus rapides et plus fiables dans des domaines allant de la médecine à l’archéologie.

Related Links