内容の概要:匂いは常に私たちの周りにあります。しかし、私たちにとって匂いを正確に表現することは困難です。最近、Google Researchの子会社であるOsmoは、グラフニューラルネットワークに基づいた臭気分析AIを開発しました。化学分子の構造に基づいて匂いを予測できます。この AI に基づいて、研究者らは主要な匂いスペクトルをマッピングし、化学構造と匂いの間のマッピングを確立しました。これは、感覚知覚研究に新しい方法を提供することが期待されています。
キーワード:臭気分析 GNN 臭気スペクトル
著者 | 雪才
編集者 | 三陽
この記事は、HyperAI Super Neural WeChat パブリック プラットフォームで初めて公開されました。~
神経科学研究における基本的な問題は、外部刺激の物理的特性を感覚認識にマッピングすることです。
視覚において、色は波長のマッピングです。聴覚において、ピッチは周波数のマッピングです。しかし、嗅覚では、匂いと物質の間のマッピングを確立するのが困難です。
現時点では、いくつかの基本的な匂いを抽出し、香りの輪を描き、それらの基本的な匂いを使用してより複雑な匂いを形成することしかできません。
図 1: 香りの輪の概略図
ただし、この大まかな分類を科学研究に使用するのは困難です。臭気を監視するために臭気センサーなどの技術が使用されていますが、これらのセンサーは特定の臭気のみを識別できます。既存の臭気識別では、多くの場合、依然として臭気評価者の参加が必要です。このプロセスは時間がかかり、再現性が低くなります。
最近、Google Research の一部門である Osmo は、グラフ ニューラル ネットワーク (GNN) に基づいた臭気分析 AI を開発しました。化学分子の構造に基づいてその匂いを表現できます。このモデルは、53% の化学分子と 55% の匂い記述子の判断において人間よりも優れています。最後に、研究者らはこのモデルを使用して POM (Principle Odor Map) を作成しました。この結果は Science 誌に掲載されました。
関連する研究が Science 誌に掲載されました
論文リンク:
https://www.science.org/doi/full/10.1126/science.ade4401
匂いは本質的に、空気中の化学分子に対する人々の反応です。したがって、化学分子の構造が匂いに影響を与える可能性があります。GNN では、化学分子の構造を解析および統合して、分子全体を表すグラフを作成します。
分子構造をモデルに入力した後、GNN は、特定の匂いに含まれるさまざまな化学構造の重みを最適化します。、最後に分子の匂いが予測層を通じて判断され、対応する匂い記述子が出力されます。
図 2: GNN モデルの概略図
Good Scents と Leffingwell & Associates データベース (GS-LF データベース) を組み合わせると、研究者らは、モデルとして 5,000 個の分子のデータベースを選択しました。各分子は、チーズのような、フルーティーななど、複数の匂いで表現できます。
図 3: GS-LF データベース内のいくつかの分子
続いて、GS-LF データベースは 8:2 の比率でトレーニング セットとテスト セットに分割され、トレーニング セットはさらに 5 つの相互検証サブセットに分割されました。
ベイジアン最適化アルゴリズムを使用してデータを相互検証し、GNN モデルのハイパーパラメーターを最適化しました。最適化が完了した後、GNN モデルは複数のアーキテクチャで安定して動作し、相互検証セットの最高 AUROC は 0.89 でした。
他の分子を区別するモデルの能力を検証するために、研究者らは GNN モデルと人間のグループに対して臭気テストを実施しました。
図 4: 2,3-ジヒドロベンゾフラン-5-カルバルデヒドの臭気を異なるモデルで判断する
A: GNN モデル。
B: RF モデル。
C: 人間のグループ。
D: 異なる評価者による 2,3-ジヒドロベンゾフラン-5-カルバルデヒドの臭気の評価。
分子 53% については、GNN モデルの匂い予測結果が人間グループの中央値よりも優れていました。現在の最先端のアルゴリズムであるカウントベースの指紋 (cFP) に基づくランダム フォレスト モデル (RF) は、41% の分子臭気予測において人間のグループよりも優れているだけです。
図 5: さまざまなモデルからの予測と人間のグループの平均との相関関係
次に研究者らは、GNN モデルの予測を臭気記述子ごとに分類しました。ジャコウを除いて、分子臭気の GNN モデルの予測結果はすべて人間グループの誤差分布内にあり、そして、30 個の匂い記述子の予測結果では、人間のグループの中央値よりも優れています。
図6:GNNモデル、RFモデル、人間グループによる異なる分子の判定結果
GNNモデルの予測結果は分子の構造に影響されます, そのため、硫黄を含むニンニク臭やアミンを含む生臭さについては、GNN モデルの方が予測精度が高くなります。ムスクには、大環状、多環状、ニトロ、ステロイド、線状という少なくとも 5 つの異なる構造が含まれているため、GNN モデルの予測結果は最悪になります。
人間のグループのパフォーマンスは親密度に影響されました。彼らは、ナッツ、ニンニク、チーズなどの従来の食品の香りの判断ではより一貫していましたが、ムスクと干し草の香りでは大きく異なりました。
同時に、トレーニング セット内の記述子の数も、GNN モデルによる特定の匂いの予測に影響します。十分な数の出現がある場合、GNN モデルは、フルーティー、フローラル、甘いフレーバーなどの複雑な構造をより正確に予測できます。
図 7: GNN モデルの予測結果と人間のグループの平均値との相関関係に対するトレーニング データの影響
しかし、出現頻度が低いフレーバーの場合、GNN モデルの精度は二極化しています。生臭さ、ミント、樟脳の予測精度は高いが、オゾン、酢酸臭、発酵臭の判定が悪い。
GNN モデルのパフォーマンスを検証した後、研究者らはさらにそれをさまざまな嗅覚タスクに使用しました。
まず、構造的に類似した分子を識別するモデルの能力をテストしました。モデルが分子の匂いを認識した後、構造が似ていて匂いが異なる分子、または構造が異なり似た匂いを持つ分子の匂いを判断する必要があります。この異常な構造と臭気の関係について、GNN モデルの判定精度は 50% であるのに対し、RF モデルの判定精度は 19% しかありません。
図8: 構造や匂いが既知の分子に近い「トリプレット」のグループ
安定した構造と臭気の関係が得られた後、研究者らは大規模な臭気プロファイルのマッピングを試み始めました。彼らは、約 500,000 個の分子の一次臭気スペクトル (POM) を完成させました。これらの分子は科学界ではまだ知られておらず、ほとんどは合成さえされていません。
ただし、スペクトル内のそれらの位置は GNN モデルによって直接計算できるため、大規模な臭気スペクトルを描画できます。これらの分子の匂いを評価するには、訓練を受けた人間の評価者が約 70 年間の継続的な作業を必要とします。
図 9: 主な臭気スペクトル
図では、各分子の匂いの座標は GNN モデルによって決定され、その色の RGB 値は、予測された匂いマトリックスの最初の 3 次元の座標に対応します。
特定の香りを嗅ぐと、過去の記憶が思い出され、その記憶がより鮮明で感情的になります。作家マルセル・プルーストは、『失われた時を求めて』の中で、語り手が紅茶に浸したマドレーヌの香りを嗅いだとき「過去が思い出された」と述べています。したがって、この現象はプルースト効果とも呼ばれます。
嗅覚と記憶は、他の感覚よりも神経系の中で密接に結びついています。これは、感情および記憶の脳領域に直接接続されている唯一の感覚システムです。嗅細胞が活性化されると、神経インパルスが梨状皮質に直接伝達されます。この脳領域には、恐怖やその他の感情を担当する扁桃体と、記憶を担当する海馬傍回が含まれます。
図 10: 嗅覚回路の構成
一次嗅覚皮質:一次嗅覚皮質。
扁桃体:扁桃体。
海馬:タツノオトシゴ。
嗅覚、記憶、感情には密接な関係があるからこそ、香水は人々の外出や出会いの必需品となっています。もしかしたら、相手はあなたに再会しても、もうあなたの名前を呼ぶことはできないかもしれませんが、この香りを嗅ぐと、きっとあなたと出会った時の光景を思い出すでしょう。
AI の助けにより、人々は分子構造と匂いの関係についてより深く理解できるようになりました。もしかしたら、いつか私たちが最も慣れ親しんだ味を実際に作り出すことができるようになるかもしれません。ボトルのキャップを開けるとタイムマシンに乗って過去の記憶を取り戻すことができます。
参考リンク:
[1] https://perfumersupplyhouse.com/2014/01/09/fragrance-creation-wheels-for-you/
[2] https://www.slideserve.com/cora-schroeder/function-neuroanatomy
この記事は、HyperAI Super Neural WeChat パブリック プラットフォームで初めて公開されました。~