Une chanson de baleine bleu ouvre des océans de données
Des chercheurs de l'Université UNSW Sydney ont développé une méthode innovante permettant de détecter les chants des baleines bleues dans des archives acoustiques s'étalant sur plusieurs décennies et vastes bassins océaniques. L'innovation réside dans le fait que le modèle d'intelligence artificielle utilisé n'a été entraîné qu'avec une seule enregistrement de chant, une performance inédite pour des réseaux de neurones profonds qui nécessitent habituellement des milliers d'exemples. La recherche, publiée dans la revue Scientific Reports et dirigée par le candidat au doctorat Ben Jancovich, utilise un réseau de neurones capable de reconnaître des motifs dans les données. Contrairement aux approches traditionnelles où les scientifiques doivent manuellement identifier chaque appel dans des enregistrements longs et complexes, cette solution automatisée surmonte les obstacles de coût et de temps. Les études écologiques à long terme reposaient souvent sur l'impossibilité d'analyser manuellement des décennies de données ou sur le manque de jeux d'entraînement pour les espèces rares. Pour pallier le manque de données, l'équipe a créé un jeu d'entraînement semi-synthétique. En partant de l'enregistrement unique d'un chant de baleine bleue, ils ont généré des milliers de variations en modifiant le pitch, la durée temporelle et en ajoutant différents types de bruit de fond. Ces modifications simulent les variations naturelles du comportement vocal et la propagation du son dans l'océan. Cette technique d'augmentation des données a permis d'entraîner un détecteur performant avec une efficacité comparable à celle des modèles nécessitant des données massives. Sur une population de baleines bleues pygmées, le système a correctement identifié 99,4 % des appels. La réussite de cette méthode repose sur la nature très stéréotypée des chants des baleines bleues. Au sein d'une même population, tous les individus produisent des sons quasi identiques, comme le montrent les différences distinctes entre les chants de celles de l'océan Indien central ou de Madagascar. Cette cohérence permet de modéliser une variation réaliste à partir d'un seul exemple. Cependant, la méthode est limitée aux espèces dont les vocalisations sont reproductibles et ne serait pas applicable à des espèces comme les dauphins, dont chaque individu possède un sifflement unique. Un autre avantage majeur de cette approche est son empreinte énergétique réduite. L'entraînement d'un modèle de ce type peut se réaliser sur un ordinateur portable standard en quelques heures, évitant ainsi la consommation massive d'électricité et de puissance de calcul associée aux grands réseaux de neurones profonds. Les implications pour l'écologie sont profondes. De vastes archives d'enregistrements sous-marins, collectées par hydrophones passifs, sont aujourd'hui peu exploitées faute d'outils de détection efficaces. Ce nouveau détecteur permettrait de débloquer ces archives pour analyser les changements à long terme, comme la modification du chant des baleines bleues sur 25 ans dans l'océan Indien central. Au-delà du suivi des populations, ces outils ouvrent des fenêtres sur le comportement animal, la culture des espèces et leur apprentissage transgénérationnel. La technique pourrait enfin être étendue à d'autres espèces produisant des appels répétables, des oiseaux aux insectes, facilitant l'étude d'espèces rares et furtives jusque-là peu entendues par les humains.
