Google Développe Une IA De Reconnaissance Des Odeurs Basée Sur GNN, Ce Qui Équivaut À 70 Ans De Travail Continu Par Des Évaluateurs Humains

Contenu en un coup d'œil :Les odeurs sont toujours autour de nous. Cependant, il nous est difficile de décrire les odeurs avec précision. Récemment, Osmo, une filiale de Google Research, a développé une IA d'analyse des odeurs basée sur des réseaux neuronaux graphiques. Il peut prédire l’odeur des molécules chimiques en fonction de leur structure. Sur la base de cette IA, les chercheurs ont cartographié le spectre principal des odeurs et établi une cartographie entre la structure chimique et l’odeur, ce qui devrait fournir une nouvelle méthode de recherche perceptive.
Mots-clés:Analyse des odeurs Spectre des odeurs GNN
Auteur | Xuecai
Rédacteur | Sanyang
Cet article a été publié pour la première fois sur la plateforme publique HyperAI WeChat~
Un problème fondamental de la recherche en neurosciences est la cartographie des propriétés physiques des stimuli externes dans les perceptions sensorielles.
En vision, la couleur est une cartographie de la longueur d’onde. En audition, la hauteur est une correspondance de fréquence.Mais dans le sens de l’odorat, la correspondance entre les odeurs et les substances est difficile à établir.
Actuellement, nous ne pouvons extraire que quelques odeurs de base, dessiner une roue des parfums, puis utiliser ces odeurs de base pour former des odeurs plus complexes.

Figure 1 : Schéma de principe de la roue des odeurs
Cependant, cette classification approximative est difficile à utiliser pour la recherche scientifique. Bien que des technologies telles que les capteurs d’odeurs soient déjà disponibles pour surveiller les odeurs, ces capteurs ne peuvent encore identifier que des odeurs spécifiques.L’identification des odeurs existantes nécessite souvent encore la participation d’évaluateurs d’odeurs, un processus qui prend du temps et dont la répétabilité est faible.
Récemment, Osmo, une branche de Google Research, a développé une IA d'analyse des odeurs basée sur des réseaux neuronaux graphiques (GNN).Il peut décrire l’odeur d’une molécule chimique en fonction de sa structure.Ce modèle surpasse les humains dans l’évaluation de 53% de molécules chimiques et de 55% de descripteurs d’odeurs.Enfin, les chercheurs ont utilisé ce modèle pour dessiner la carte principale du spectre des odeurs POM (Principle Odor Map).Ce résultat a été publié dans Science.

Des recherches connexes ont été publiées dans Science
Lien vers l'article :
https://www.science.org/doi/full/10.1126/science.ade4401
Procédures expérimentales
Les modèles GNN sont stables sur plusieurs architectures
L’odorat est essentiellement la perception qu’ont les gens des molécules chimiques présentes dans l’air.Par conséquent, la structure des molécules chimiques affectera l’odeur.Dans GNN, la structure des molécules chimiques est analysée et intégrée pour former un graphique représentant la molécule entière.
Une fois la structure moléculaire introduite dans le modèle,GNN optimise les poids de différentes structures chimiques dans une odeur particulièreEnfin, l’odeur de la molécule est jugée via la couche de prédiction et le mot de description d’odeur correspondant est émis.

Figure 2 : Schéma du modèle GNN
Combinaison des bases de données Good Scents et Leffingwell & Associates (bases de données GS-LF),Les chercheurs ont sélectionné 5 000 molécules comme base de données pour le modèle.Chaque molécule peut être décrite par plusieurs odeurs, telles que le fromage, le fruité, etc.

Figure 3 : Quelques molécules dans la base de données GS-LF
Par la suite, la base de données GS-LF a été divisée en ensembles d'entraînement et de test dans un rapport de 8:2, et l'ensemble d'entraînement a été divisé en cinq sous-ensembles de validation croisée.
L'algorithme d'optimisation bayésienne a été utilisé pour valider les données et optimiser les hyperparamètres du modèle GNN.Après optimisation, le modèle GNN a fonctionné de manière stable dans plusieurs architectures, l'AUROC le plus élevé atteignant 0,89 dans l'ensemble de validation croisée.
Les modèles GNN surpassent les humains dans la prédiction des odeurs
Pour vérifier la capacité du modèle à distinguer d’autres molécules, les chercheurs ont effectué des tests d’odeur sur le modèle GNN et sur un groupe humain.

Figure 4 : Jugement de l'odeur du 2,3-dihydrobenzofuran-5-carboxaldéhyde par différents modèles
A : modèle GNN ;
B : modèle RF ;
C : Groupe humain ;
D : Évaluation de l'odeur du 2,3-dihydrobenzofuran-5-carbaldéhyde par différents évaluateurs.
Pour la molécule 53%, les résultats de prédiction d’odeur du modèle GNN étaient meilleurs que la médiane du groupe humain.L'algorithme le plus avancé, le modèle de forêt aléatoire (RF) basé sur l'empreinte digitale basée sur le comptage (cFP), a surpassé le groupe humain uniquement dans la prédiction de l'odeur moléculaire du 41%.

Figure 5 : Corrélation des prédictions de différents modèles avec la moyenne du groupe humain
Les chercheurs ont ensuite classé les prédictions du modèle GNN en descripteurs d’odeurs. À l’exception du musc, les résultats de prédiction du modèle GNN pour les odeurs moléculaires se situent tous dans la distribution d’erreur du groupe humain.Et il surpasse la médiane du groupe humain dans les résultats de prédiction de 30 descripteurs d'odeurs.

Figure 6 :Résultats du jugement du modèle GNN, du modèle RF et du groupe humain sur différentes molécules
Les résultats de prédiction du modèle GNN sont affectés par la structure de la moléculePar conséquent, pour l’odeur d’ail contenant du soufre et l’odeur de poisson contenant des amines, le modèle GNN a une précision de prédiction plus élevée. Le musc contient au moins cinq structures différentes : macrocyclique, polycyclique, nitro, stéroïdienne et linéaire, de sorte que les résultats de prédiction du modèle GNN sont les pires.
La performance du groupe humain était affectée par la familiarité.Ils étaient plus cohérents dans leurs jugements sur les arômes alimentaires courants tels que les noix, l’ail et le fromage, mais présentaient de plus grandes différences dans leurs jugements sur le musc et le foin.
Dans le même temps, le nombre de descripteurs dans l’ensemble d’entraînement affectera également la prédiction d’une certaine odeur par le modèle GNN.Lorsque le nombre d’occurrences est suffisamment élevé, le modèle GNN peut faire des prédictions relativement précises de structures complexes, telles que les saveurs fruitées, florales et sucrées.

Figure 7 : Effet des données d'entraînement sur la corrélation entre les résultats de prédiction du modèle GNN et la moyenne du groupe humain
Cependant,Pour les saveurs qui apparaissent moins fréquemment, la précision du modèle GNN est polarisée.La précision de prédiction pour l'odeur de poisson, la menthe et le camphre était élevée, mais le jugement pour l'ozone, l'acide acétique et le goût fermenté était médiocre.
Le modèle GNN dessine le spectre principal des odeurs
Après avoir vérifié les performances du modèle GNN, les chercheurs l’ont utilisé dans différentes tâches olfactives.
Tout d’abord, ils ont testé la capacité du modèle à identifier des molécules ayant des structures similaires.Une fois que le modèle connaît l’odeur d’une molécule, il doit juger les odeurs des molécules ayant des structures similaires mais des odeurs différentes et des molécules ayant des structures différentes mais des odeurs similaires.Pour cette relation anormale structure-odeur, le modèle GNN a une précision de jugement de 50%, tandis que le modèle RF n'a que 19%.

Figure 8 : Un groupe de triplets dont les structures ou les odeurs sont proches de molécules connues
Après avoir obtenu une relation structure-odeur stable, les chercheurs ont commencé à essayer de dessiner un spectre d’odeurs à grande échelle.Ils ont complété la carte des odeurs primaires (POM) pour environ 500 000 molécules.Ces molécules sont encore inconnues dans le domaine scientifique, et la plupart d’entre elles n’ont même pas été synthétisées.
Cependant, leurs positions dans le spectrogramme peuvent être directement calculées par le modèle GNN, ce qui permet de dessiner un spectre d'odeurs à grande échelle.Si un évaluateur humain qualifié devait évaluer l’odeur de ces molécules, cela prendrait environ 70 ans de travail continu.

Figure 9 : Spectre olfactif principal
Dans la figure, les coordonnées de chaque odeur moléculaire sont déterminées par le modèle GNN, et la valeur RVB de sa couleur correspond aux coordonnées des trois premières dimensions de la matrice d'odeur prédite.
L'effet Proust : le lien entre l'odorat et la mémoire
Lorsque nous sentons une certaine odeur, cela nous rappelle un souvenir passé, et l’odeur rend ce souvenir plus vif et plus émotionnel.Dans À la recherche du temps perdu, l'écrivain Marcel Proust note que lorsque le narrateur sent les madeleines trempées dans le thé, « le passé lui revient ». C'est pourquoi ce phénomène est également appelé effet Proust.
L’odorat est plus étroitement lié à la mémoire dans le système nerveux que tout autre sens.C'est le seul système sensoriel directement connecté aux zones émotionnelles et mémorielles du cerveau.Lorsque les cellules olfactives sont activées, les impulsions nerveuses sont transmises directement au cortex piriforme. Cette zone du cerveau comprend l’amygdale, responsable de la peur et d’autres émotions, et le gyrus parahippocampique, responsable de la mémoire.

Figure 10 : Composants du circuit olfactif
Cortex olfactif primaire : cortex olfactif primaire ;
Amygdale : amygdale ;
Hippocampe : hippocampe.
C’est précisément en raison du lien étroit entre l’odorat, la mémoire et l’émotion que le parfum est devenu un incontournable pour les gens lorsqu’ils sortent et rencontrent des gens. Peut-être que l'autre personne ne pourra pas prononcer votre nom lorsqu'elle vous reverra, mais lorsqu'elle sentira cette odeur, elle se souviendra certainement de la scène où elle vous a rencontré.
Grâce à l’IA, les gens ont une compréhension plus approfondie du lien entre la structure moléculaire et l’odeur.Peut-être qu’un jour, nous pourrons vraiment mélanger les saveurs que nous connaissons le mieux. Ouvrez le bouchon de la bouteille et vous pourrez prendre une machine à remonter le temps et revenir dans le passé.
Liens de référence :
[1] https://perfumersupplyhouse.com/2014/01/09/fragrance-creation-wheels-for-you/
[2] https://www.slideserve.com/cora-schroeder/function-neuroanatomy
Cet article a été publié pour la première fois sur la plateforme publique HyperAI WeChat~