구글, GNN 기반 냄새 인식 AI 개발…인간 평가자 70년간의 끊임없는 노력에 해당

내용을 한눈에 보기:냄새는 항상 우리 주변에 있습니다. 하지만 우리가 냄새를 정확하게 설명하는 것은 어렵습니다. 최근, 구글 리서치의 자회사인 오스모(Osmo)는 그래프 신경망을 기반으로 한 냄새 분석 AI를 개발했습니다. 화학 분자의 구조를 바탕으로 냄새를 예측할 수 있습니다. 연구진은 이 AI를 기반으로 주요 냄새 스펙트럼을 매핑하고 화학 구조와 냄새 간의 매핑을 확립했으며, 이는 인지 연구에 새로운 방법을 제공할 것으로 기대됩니다.
키워드:냄새 분석 GNN 냄새 스펙트럼
저자 | 쉐차이
편집자 | 산양
본 기사는 HyperAI WeChat 공개 플랫폼에 처음 게재되었습니다.~
신경과학 연구의 근본적인 문제 중 하나는 외부 자극의 물리적 특성을 감각적 지각으로 매핑하는 것입니다.
시각에서 색상은 파장의 매핑입니다. 청각에서 음높이는 주파수의 매핑입니다.하지만 후각에 있어서 냄새와 물질 사이의 연결은 확립하기 어렵습니다.
현재 우리는 몇 가지 기본적인 냄새만 추출하고, 향기 휠을 그린 다음, 이 기본적인 냄새를 이용해 더 복잡한 냄새를 형성할 수 있습니다.

그림 1: 냄새 휠의 개략도
하지만 이런 대략적인 분류는 과학적 연구에 사용하기 어렵다. 냄새 센서와 같은 기술은 이미 냄새를 모니터링하는 데 사용 가능하지만, 이러한 센서는 여전히 특정 냄새만 식별할 수 있습니다.기존의 냄새 식별에는 여전히 냄새 평가자의 참여가 필요한데, 이 과정은 시간이 많이 걸리고 반복성이 낮습니다.
최근, 구글 연구소의 한 부서인 Osmo는 그래프 신경망(GNN)을 기반으로 한 냄새 분석 AI를 개발했습니다.이는 화학 분자의 구조를 바탕으로 그 냄새를 설명할 수 있습니다.이 모델은 화학 분자의 53%와 냄새 설명자의 55%를 판단하는 데 있어 인간보다 우수한 성능을 보입니다.마지막으로 연구자들은 이 모델을 사용하여 주요 냄새 스펙트럼 지도인 POM(Principle Odor Map)을 그렸습니다.이 결과는 Science에 게재되었습니다.

관련 연구는 Science에 게재되었습니다.
논문 링크:
https://www.science.org/doi/full/10.1126/science.ade4401
실험 절차
GNN 모델은 여러 아키텍처에서 안정적입니다.
후각은 본질적으로 사람들이 공기 중의 화학 분자를 인지하는 것입니다.따라서 화학 분자의 구조는 냄새에 영향을 미칩니다.GNN에서는 화학 분자의 구조를 분석하고 통합하여 전체 분자를 나타내는 그래프를 형성합니다.
분자구조를 모델에 입력하면,GNN은 특정 냄새의 다양한 화학 구조의 무게를 최적화합니다.마지막으로, 예측 레이어를 통해 분자의 냄새를 판단하고, 해당 냄새 설명어를 출력합니다.

그림 2: GNN 모델의 개략도
Good Scents 및 Leffingwell & Associates 데이터베이스(GS-LF 데이터베이스)를 결합하면연구진은 모델을 위한 데이터베이스로 5,000개의 분자를 선택했습니다.각 분자는 치즈, 과일 등 여러 가지 냄새로 표현될 수 있습니다.

그림 3: GS-LF 데이터베이스의 일부 분자
이후 GS-LF 데이터베이스는 8:2의 비율로 훈련 세트와 테스트 세트로 나뉘었고, 훈련 세트는 다시 5개의 교차 검증 하위 세트로 나뉘었습니다.
베이지안 최적화 알고리즘을 사용하여 데이터를 교차 검증하고 GNN 모델의 하이퍼 매개변수를 최적화했습니다.최적화 후, GNN 모델은 다양한 아키텍처에서 안정적으로 수행되었으며, 교차 검증 세트에서 가장 높은 AUROC가 0.89에 도달했습니다.
GNN 모델은 냄새 예측에서 인간보다 우수한 성능을 보입니다.
연구진은 모델이 다른 분자를 구별하는 능력을 검증하기 위해 GNN 모델과 인간 집단에 대한 냄새 테스트를 실시했습니다.

그림 4: 다양한 모델을 통한 2,3-디하이드로벤조푸란-5-카복스알데히드의 냄새 판단
A: GNN 모델;
B: RF 모델;
C: 인간 그룹;
D: 다양한 평가자에 의한 2,3-디하이드로벤조푸란-5-카발데히드의 냄새 평가.
분자 53%의 경우, GNN 모델의 냄새 예측 결과는 인간 그룹의 중앙값보다 더 좋았습니다.가장 진보된 알고리즘인 카운트 기반 지문(cFP)을 기반으로 한 랜덤 포레스트 모델(RF)은 41%의 분자적 냄새 예측에서만 인간 그룹보다 우수한 성과를 보였습니다.

그림 5: 다양한 모델의 예측과 인간 그룹의 평균 간의 상관 관계
그런 다음 연구자들은 GNN 모델의 예측을 냄새 설명자로 분류했습니다. 사향을 제외하고, 분자 냄새에 대한 GNN 모델의 예측 결과는 모두 인간 그룹의 오차 분포 내에 있습니다.그리고 30가지 냄새 설명자에 대한 예측 결과에서 인간 집단의 중간값을 능가했습니다.

그림 6:GNN 모델, RF 모델 및 인간 집단의 다양한 분자에 대한 판단 결과
GNN 모델의 예측 결과는 분자 구조에 영향을 받습니다.따라서 유황이 함유된 마늘 냄새와 아민이 함유된 생선 냄새의 경우 GNN 모델의 예측 정확도가 더 높습니다. 머스크는 거대고리형, 다고리형, 니트로형, 스테로이드형, 선형형 등 최소 5가지의 서로 다른 구조를 포함하고 있으므로 GNN 모델의 예측 결과는 최악입니다.
인간 집단의 성과는 친숙함에 영향을 받았습니다.그들은 견과류, 마늘, 치즈와 같은 흔한 음식 향에 대한 판단에 있어서는 일관성이 있었지만, 사향과 건초에 대한 판단에는 더 큰 차이가 있었습니다.
동시에, 훈련 세트에 있는 설명자의 수는 GNN 모델의 특정 냄새 예측에도 영향을 미칩니다.발생 횟수가 충분히 많으면 GNN 모델은 과일, 꽃, 달콤한 맛과 같은 복잡한 구조를 비교적 정확하게 예측할 수 있습니다.

그림 7: GNN 모델 예측 결과와 인간 그룹 평균 간의 상관 관계에 대한 훈련 데이터의 영향
하지만,덜 자주 등장하는 맛의 경우 GNN 모델의 정확도는 양극화됩니다.생선 냄새, 민트, 樟腦에 대한 예측 정확도는 높았지만, 오존, 아세트산, 발효 맛에 대한 판단은 좋지 않았습니다.
GNN 모델은 주요 냄새 스펙트럼을 그립니다.
연구진은 GNN 모델의 성능을 검증한 후 이를 다양한 후각 작업에 활용했습니다.
먼저, 그들은 유사한 구조를 가진 분자를 식별하는 모델의 능력을 테스트했습니다.모델이 분자의 냄새를 알게 되면, 구조는 비슷하지만 냄새가 다른 분자와 구조는 다르지만 냄새가 비슷한 분자의 냄새를 판단해야 합니다.이러한 비정상적인 구조-냄새 관계에 대해 GNN 모델은 50%의 판단 정확도를 갖는 반면, RF 모델은 19%에 불과합니다.

그림 8: 구조나 냄새가 알려진 분자와 가까운 삼중체 그룹
연구자들은 안정적인 구조-냄새 관계를 얻은 후, 대규모 냄새 스펙트럼을 그리기 시작했습니다.그들은 약 50만 개의 분자에 대한 주요 냄새 지도(POM)를 완성했습니다.이러한 분자들은 과학 분야에서 아직 알려지지 않은 것들이며, 대부분은 합성조차 되지 않았습니다.
그러나 스펙트로그램에서의 위치는 GNN 모델을 통해 직접 계산할 수 있으므로 대규모 냄새 스펙트럼을 그릴 수 있습니다.만약 훈련된 인간 평가자가 이 분자의 냄새를 평가하려면 약 70년 동안 끊임없이 노력해야 할 것입니다.

그림 9: 주요 냄새 스펙트럼
그림에서 각 분자 냄새의 좌표는 GNN 모델에 의해 결정되며, 해당 색상의 RGB 값은 예측된 냄새 행렬의 처음 세 차원의 좌표에 해당합니다.
프루스트 효과: 후각과 기억의 연관성
우리가 특정 향을 맡으면 과거의 기억이 떠오르고, 그 향은 그 기억을 더욱 생생하고 감정적으로 만들어줍니다.작가 마르셀 프루스트의 '잃어버린 시간을 찾아서'에서, 화자가 차에 담근 마들렌 냄새를 맡으면 "과거가 그에게 돌아온다"고 적고 있습니다. 따라서 이 현상을 프루스트 효과라고도 부른다.
후각은 다른 어떤 감각보다 신경계의 기억과 더 밀접하게 연결되어 있습니다.그것은 뇌의 감정 및 기억 영역과 직접 연결된 유일한 감각 시스템입니다.후각 세포가 활성화되면 신경 자극이 배측피질로 직접 전달됩니다. 이 뇌 영역에는 두려움과 다른 감정을 담당하는 편도체와 기억을 담당하는 해마주위회가 포함됩니다.

그림 10: 후각 회로의 구성 요소
1차 후각 피질: 1차 후각 피질;
편도체: 편도체;
해마: 해마.
냄새, 기억, 감정이 서로 밀접하게 연관되어 있기 때문에 사람들이 외출하거나 사람을 만날 때 향수가 필수품이 되었습니다. 상대방이 당신을 다시 만났을 때 당신의 이름을 부를 수는 없겠지만, 이 향을 맡으면 당신을 만났을 때의 그 장면을 꼭 기억할 것입니다.
AI의 도움으로 사람들은 분자 구조와 후각의 연관성을 더 깊이 이해할 수 있게 됐습니다.어쩌면 언젠가는 우리가 가장 익숙한 맛을 실제로 섞을 수 있게 될지도 모릅니다. 병뚜껑을 열면 타임머신을 타고 과거로 돌아갈 수 있어요.
참조 링크:
[1] https://perfumersupplyhouse.com/2014/01/09/fragrance-creation-wheels-for-you/
[2] https://www.slideserve.com/cora-schroeder/function-neuroanatomy
본 기사는 HyperAI WeChat 공개 플랫폼에 처음 게재되었습니다.~